I servizi di raccolta dati vocali più affidabili per la tua intelligenza artificiale
Addestra i tuoi modelli NLP, VA, prototipi TTS e altro ancora con dati conversazionali di qualitĆ , con i nostri servizi di raccolta dati audio e vocali
Scopri pipeline di dati audio senza colli di bottiglia.
Clienti in primo piano
Perché è necessario il set di dati di formazione vocale per l'elaborazione del linguaggio naturale?
Hai mai notato che il tuo smartphone VA, ad esempio Siri, Bixby o altro, interagisce? Il modo in cui rispondono a ogni domanda e analizzano e presentano i risultati secondo le tue esigenze!
Bene, per quanto questi VA ci intrigano, queste risorse e programmi intelligenti devono essere addestrati progressivamente per essere in grado di rispondere con la stessa precisione. Questo ĆØ il motivo per cui dovresti prendere in considerazione l'esternalizzazione della raccolta di dati vocali/audio e voce a societĆ specializzate nella raccolta di dati, con una valida esperienza professionale.
Investire nella raccolta di dati audio prepara la tua presunta PNL a soddisfare un pubblico multilingue. Non solo, la raccolta dei dati vocali per la PNL, come e quando gestita da un esperto, tiene conto anche della raccolta sul campo, dell'analisi semantica e della trascrizione audio. Con le soluzioni di raccolta dati vocali professionali, puoi:
- Procurati set di dati audio di alta qualitĆ per migliorare la precisione
- Scegli come target la configurazione di scenari diversi
- Raccogli dati di addestramento IA multilingue
- Ridimensiona il tuo modello ML per adattarsi a diversi dati demografici e verticali
Servizi professionali di raccolta dati audio/voce per la PNL
Qualsiasi argomento. Qualsiasi scenario.
I sistemi NLP intelligenti sono tutt'altro che generici. A seconda della funzionalitĆ del programma, potrebbe essere necessario concentrarsi su servizi di dati audio spaziali e multilingue, che possono essere offerti solo da rinomate societĆ di raccolta dati voce/audio. Ć qui che Shaip entra nello schema delle cose come fornitore di servizi di connessione dati altamente affidabile che ĆØ orgoglioso di fare il lavoro pesante per le tue IA presumibilmente intelligenti.
In Shaip, il nostro obiettivo principale è fornire modelli con il volume più alto possibile di campioni vocali personalizzati, nel minor tempo possibile. Con noi a bordo, puoi aspettarti:
- Raccolta di dati audio/voce curata per la PNL
- Programmi su misura che rispondono secondo casi d'uso specifici
- Preparare il mining di set di dati audio
- Elaborazione dei dati specifica e automatizzata
- Il più alto livello possibile di specificità del dominio
- Time-to-market più rapido con i modelli di intelligenza artificiale accelerati
La nostra competenza
Allinea i dati audio per preparare i modelli Smart NLP
Shaip offre servizi di raccolta dati vocali/audio end-to-end in oltre 100 lingue per consentire alle tecnologie abilitate alla voce di soddisfare un pubblico diversificato in tutto il mondo. Possiamo lavorare su progetti di qualsiasi portata e dimensione; dalla licenza di set di dati audio standard esistenti, alla gestione della raccolta di dati audio personalizzati, alla trascrizione e annotazione dell'audio. Indipendentemente dalle dimensioni del tuo progetto di raccolta dei dati vocali, possiamo personalizzare i servizi di raccolta audio in base alle tue esigenze per creare set di dati NLP di alta qualitĆ destinati a dialetti, toni e lingue. Scegli dalla nostra vasta gamma di set di dati vocali e risorse di raccolta dati audio, per configurazioni intelligenti con abilitazione vocale.
Collezione di discorsi di monologo
Gestisci i requisiti vocali relativi a un relatore autonomo per i tuoi prototipi Text-to-Speed āāe i requisiti specifici delle trascrizioni con alimentazione di prompt con script, tramite file a canale singolo.
Discorso di dialogo
Collezione
Configura assistenti virtuali intelligenti, chatbot specifici per la velocitĆ e modelli di riconoscimento vocale automatico con esposizione multilingue tramite file a doppio canale e risorse trascritte.
Dati acustici
Collezione
Possiamo registrare professionalmente dati audio di qualità da studio che si tratti di ristoranti, uffici o case o da vari ambienti e lingue, attraverso la nostra rete globale di collaboratori, coprendo al contempo una gamma acustica più ampia
Raccolta di enunciati in linguaggio naturale
Addestra configurazioni commerciali intelligenti per identificare frasi dei clienti pronunciate in modo diverso con significato simile, per rendere le IA più autonome nel tempo
Digitale / Virtuale
Assistenti
Concentrati sulla creazione del tuo prossimo assistente virtuale addestrando modelli con avvertenze sul linguaggio umano, esposizione multilingue, analisi contestuale e NLU.
Riconoscimento vocale automatico (ASR)
Migliora la precisione dei tuoi sistemi di riconoscimento vocale automatico (ASR) accedendo a set di dati vocali/audio diversificati all'avanguardia, da un'ampia gamma di dati demografici.
Dati di formazione vocale/audio multilingue
I nostri professionisti linguistici altamente qualificati in tutto il mondo offrono dati di formazione audio/vocale multilingue in più lingue e dialetti tra cui arabo, danese, cinese, afrikaans, Singapore, Nuova Zelanda, ebraico, indonesiano, irlandese, coreano, malese, polacco, scozzese, svedese , francese, tedesco, vietnamita, tailandese, italiano, spagnolo e altro.
Text-to-Speech
(STT)
Per offrire una migliore esperienza utente con TTS, lo sviluppo di un sistema che suoni naturale ĆØ fondamentale. Crea un modello multilingue di sintesi vocale (TTS) con l'aiuto della nostra forza lavoro globale, che ti aiuta a raccogliere dati vocali in oltre 150 lingue e dialetti per migliorare i tuoi modelli di intelligenza artificiale dai controlli in auto ai chatbot e alle soluzioni di apprendimento ad alta dati audio di qualitĆ .
Motivi per scegliere Shaip come partner affidabile per la raccolta di dati vocali
Persone
Team dedicati e formati:
- Oltre 30,000 collaboratori per la creazione di dati, l'etichettatura e il controllo qualitĆ
- Team di gestione del progetto con credenziali
- Team di sviluppo prodotto esperto
- Talent Pool Sourcing & Onboarding Team
Processo
La massima efficienza del processo ĆØ assicurata da:
- Robusto processo Stage-Gate 6 Sigma
- Un team dedicato di cinture nere 6 Sigma: titolari di processi chiave e conformitĆ alla qualitĆ
- Miglioramento continuo e ciclo di feedback
Piattaforma
La piattaforma brevettata offre vantaggi:
- Piattaforma end-to-end basata sul web
- QualitĆ impeccabile
- TAT . più veloce
- Consegna senza soluzione di continuitĆ
Persone
Team dedicati e formati:
- Oltre 30,000 collaboratori per la creazione di dati, l'etichettatura e il controllo qualitĆ
- Team di gestione del progetto con credenziali
- Team di sviluppo prodotto esperto
- Talent Pool Sourcing & Onboarding Team
Processo
La massima efficienza del processo ĆØ assicurata da:
- Robusto processo Stage-Gate 6 Sigma
- Un team dedicato di cinture nere 6 Sigma: titolari di processi chiave e conformitĆ alla qualitĆ
- Miglioramento continuo e ciclo di feedback
Piattaforma
La piattaforma brevettata offre vantaggi:
- Piattaforma end-to-end basata sul web
- QualitĆ impeccabile
- TAT . più veloce
- Consegna senza soluzione di continuitĆ
Lingua: set di dati audio raccolti
Set di dati vocali/audio pronti all'uso
Dettagli | ID corpo (unico) | Parola chiave | Set di dati della lingua | Codice lingua | Frequenza di Campionamento | Tipo di set di dati | Ore audio totali | Breve Descrizione | Descrizione del set di dati | Canale audio | Piattaforma di registrazione | ER (%) | Formato Audio | Formato di trascrizione | Usa caso | Numero di altoparlanti | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
it_US_CC_8 | volgare afroamericano | volgare afroamericano | it_IT | 8 kHz | Call center | 211 | Dati del call center in vernacolo afroamericano | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, | Doppio | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmine: 612, maschi: 1242 e sconosciute: 12 | Contatti | |
it_US_MA_16 | volgare afroamericano | volgare afroamericano | it_IT | 16 kHz | Audio multimediale | 154 | Dati dei media vernacolari afroamericani | Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti | Mono | Approvvigionamento Web | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmine: 151, maschi: 150 e sconosciute: 10 | Contatti | |
Afrikaans_GC_8 | afrikaans | afrikaans | af_ZA | 8 kHz | Conversazione generale | 368 | Dati di conversazione generale in afrikaans | Conversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti, afrikaans parlato in Africa | Doppio | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmine: 502, maschi: 390 e sconosciute: 2 | Contatti | |
Afrikaans_MA_16 | afrikaans | afrikaans | af_ZA | 16 kHz | Audio multimediale | 658 | File multimediali afrikaans | Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti | Mono | Approvvigionamento Web | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmine: 750, maschi: 1278 e sconosciute: 52 | Contatti | |
Arabo_GC_8 | Arabo | Arabo | ar_AE | 8 kHz | Conversazione generale | 292 | Dati di conversazioni generali in arabo | Conversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti, arabo dai paesi del Golfo | Doppio | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmine: 171, maschi: 534 e sconosciute: 1 | Contatti | |
Arabo_SM_48 | Arabo | Arabo | ar-SA | 48 kHz | Monologo sceneggiato | 1,947 | Monologo scritto in arabo | Registrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondi | Mono | mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 838 Maschio 1209 Sconosciuto 78 | Contatti | |
Assamese_CC_8 | Assamese | Assamese (in pipeline) | come in | Call center | 60 | Dati del Call Center Assamese (In Pipeline). | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contatti | ||||
Assamese_GC | Assamese | Assamese (in pipeline) | come in | Conversazione generale | 100 | Assamese (In Pipeline) Dati di conversazione generale | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contatti | ||||
Assamese_MA | Assamese | Assamese (in pipeline) | come in | Audio multimediale | 40 | Assamese (In Pipeline) Dati audio multimediali | Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti | Approvvigionamento Web | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contatti | ||||
bengalese_CC_8 | Bengalese | Bengalese (in cantiere) | bn_IN | Call center | 60 | Dati del call center bengalese (in pipeline). | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contatti | ||||
bengalese_GC | Bengalese | Bengalese (in cantiere) | bn_IN | Conversazione generale | 100 | Dati di conversazione generale in bengalese (in pipeline). | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contatti | ||||
bengalese_MA | Bengalese | Bengalese (in cantiere) | bn_IN | Audio multimediale | 40 | Bengalese (In Pipeline) Dati audio multimediali | Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti | Approvvigionamento Web | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contatti | ||||
Boston_CC_8 | Boston inglese | Boston inglese | it_IT | 8 kHz | Call center | 177 | Dati del call center di Boston | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, | Doppio | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmine: 605, maschi: 711 e sconosciute: 0 | Contatti | |
Boston_GC_8 | Boston inglese | Boston inglese | it_IT | 8 kHz | Conversazione generale | 32 | Dati di conversazione generale di Boston | Conversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti, | Doppio | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmine: 53, maschi: 83 e sconosciute: 0 | Contatti | |
Boston_MA_16 | Boston inglese | Boston inglese | it_IT | 16 kHz | Audio multimediale | 93 | Dati audio di Boston Media | Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti | Mono | Approvvigionamento Web | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmine: 43, maschi: 181 e sconosciute: 2 | Contatti | |
Canadese_SM_48 | Francese canadese | Francese canadese | fr-CA | 48 kHz | Monologo sceneggiato | 1,222 | Francese canadese | Registrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondi | Mono | mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 974 Maschio 631 Sconosciuto 1 | Contatti | |
Cinese_CC_8 | Inglese cinese | Inglese cinese | it_IT | 8 kHz | Call center | 169 | Dati del call center cinese | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, | Doppio | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina: 1790, Maschio: 523 e Sconosciuto: 13 | Contatti | |
Cinese_MA_16 | Inglese cinese | Inglese cinese | it_IT | 16 kHz | Audio multimediale | 249 | Dati audio dei media cinesi | Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti | Mono | Approvvigionamento Web | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina: 126, Maschio: 346 e Sconosciuto: 6 | Contatti | |
Cinese semplificato_SM_48 | Cinese semplificato | Cinese semplificato | ZH-CN | 48 kHz | Monologo sceneggiato | 2,762 | Cinese semplificato | Registrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondi | Mono | mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 1920 Maschio 1535 Sconosciuto 270 | Contatti | |
Cinese tradizionale_SM_48 | Cinese tradizionale | Cinese tradizionale | zh-TW | 48 kHz | Monologo sceneggiato | 1,028 | Cinese tradizionale | Registrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondi | Mono | mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 1069 Maschio 262 Sconosciuto 3 | Contatti | |
Danese_GC_8 | Danese | Danese | da_DK | 8 kHz | Conversazione generale | 372 | Dati di conversazioni generali danesi | Conversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti, | Doppio | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Donne: 311, Uomini: 417, Sconosciuto: 0 | Contatti | |
Danese_MA_16 | Danese | Danese | da_DK | 16 kHz | Audio multimediale | 664 | Dati audio dei media danesi | Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti | Mono | Approvvigionamento Web | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Donne: 369, Uomini: 864, Sconosciuto: 27 | Contatti | |
Danese_SM_48 | Danese | Danese | DA-DK | 48 kHz | Monologo sceneggiato | 2,579 | Monologo con sceneggiatura danese | Registrazioni a enunciato singolo, che tendono a rientrare nell'intervallo da 5 a 30 secondi, danese dalla Danimarca | Mono | mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 1551 Maschio 1233 Sconosciuto 42 | Contatti | |
Inglese profondo sud_CC_8 | Inglese profondo sud | Inglese profondo sud | it_IT | 8 kHz | Call center | 151 | Dati del call center del profondo sud inglese | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, | Doppio | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 221 , Maschio 1004 , Sconosciuto 7 | Contatti | |
Inglese profondo sud_GC_8 | Inglese profondo sud | Inglese profondo sud | it_IT | 8 kHz | Conversazione generale | 56 | Dati di conversazione generale del profondo sud inglese | Conversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti, | Doppio | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 99, Maschio 31, Sconosciuto 0 | Contatti | |
Inglese profondo sud_MA_16 | Inglese profondo sud | Inglese profondo sud | it_IT | 16 kHz | Audio multimediale | 266 | Dati audio di Deep South Media in inglese | Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti | Mono | Approvvigionamento Web | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 204, Maschio 356, Sconosciuto 21 | Contatti | |
Tedesco_CC_8 | Tedesco | Tedesco | de-De | 8 kHz | Call center | 64 | Dati del call center tedesco | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, | Mono | Desktop | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 478 Maschio 1440 Sconosciuto 0 | Contatti | ||
Tedesco_IVR_8 | Tedesco | Tedesco | de-De | 8 kHz | IVR | 200 | Dati IVR tedeschi | Da uomo a macchina. Un flusso di tipo IVR in cui ĆØ presente un prompt TTS (ad es. "Come posso aiutarti") seguito da una risposta umana spontanea | Mono | Desktop | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 10115 Maschio 8750 Sconosciuto 0 | Contatti | ||
Gujarati_CC_8 | Gujarati | Gujarati (in cantiere) | gu_IN | Call center | 60 | Gujarati (In Pipeline) Dati del call center | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contatti | ||||
Gujarati_GC | Gujarati | Gujarati (in cantiere) | gu_IN | Conversazione generale | 100 | Dati di conversazione generale gujarati (in pipeline). | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contatti | ||||
Gujarati_MA | Gujarati | Gujarati (in cantiere) | gu_IN | Audio multimediale | 40 | Gujarati (In Pipeline) Dati audio multimediali | Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti | Approvvigionamento Web | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contatti | ||||
Ebraico_Conversazione Generale_8 | ebraico | ebraico | lui_IL | 8 kHz | Conversazione generale | 399 | Dati di conversazione generale in ebraico | Conversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti, ebraico in Israele | Doppio | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 414 , Maschio 399 , Sconosciuto 1 | Contatti | |
Ebraico_MA_16 | ebraico | ebraico | lui_IL | 16 kHz | Audio multimediale | 427 | Dati audio dei media ebraici | Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti | Mono | Approvvigionamento Web | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 361, Maschio 513, Sconosciuto 13 | Contatti | |
Hindi_MA_16 | Hindi | Hindi | ciao_IN | 16 kHz | Audio multimediale | 219 | Hindi Media dati audio | Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti | Mono | Approvvigionamento Web | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 83, Maschio 309, Sconosciuto 0 | Contatti | |
hindi_SM_48 | Hindi | Hindi | ciao-IN | 48 kHz | Monologo sceneggiato | 2,867 | Monologo scritto in hindi | Registrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondi | Mono | mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 1977 Maschio 1864 Sconosciuto 147 | Contatti | |
INGLESE_CC_8 | Hinglish | Hinglish | hg_IN | 8 kHz | Call center | 208 | HINGLISH Dati del call center | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, | Doppio | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 822, Maschio 1262 , Sconosciuto 0 | Contatti | |
HINGLISH_MA_16 | Hinglish | Hinglish | hg_IN | 16 kHz | Audio multimediale | 216 | HINGLISH Dati audio multimediali | Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti | Mono | Approvvigionamento Web | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 75, Maschio 380, Sconosciuto 0 | Contatti | |
Ispanico_CC_8 | inglese ispanico | inglese ispanico | it_IT | 8 kHz | Call center | 212 | Dati del call center ispanico | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, | Doppio | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 822, Maschio 1262, Sconosciuto 0 | Contatti | |
Ispanico_MA_16 | inglese ispanico | inglese ispanico | it_IT | 16 kHz | Audio multimediale | 155 | Audio multimediale per chiamate ispaniche | Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti | Mono | Approvvigionamento Web | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 140, Maschio 219, Sconosciuto 5 | Contatti | |
Indonesiano_GC_8 | Indonesiano | Indonesiano | L'ho fatto | 8 kHz | Conversazione generale | 496 | Dati di conversazione generale indonesiana | Conversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti, indonesiano bahasa | Doppio | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 524, Maschio 454, Sconosciuto 2 | Contatti | |
Indonesiano_MA_16 | Indonesiano | Indonesiano | L'ho fatto | 16 kHz | Audio multimediale | 643 | Dati audio multimediali indonesiani | Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti | Mono | Approvvigionamento Web | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 746, Maschio 1507, Sconosciuto 129 | Contatti | |
irlandese_GC_8 | irlandese | irlandese | it_IT | 8 kHz | Conversazione generale | 192 | Dati sulla conversazione generale irlandese | Conversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti, | Doppio | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 213 , Maschio 153 , Sconosciuto 0 | Contatti | |
Giapponese_SM_48 | Giapponese | Giapponese | ja-JP | 48 kHz | Monologo sceneggiato | 2,335 | Monologo scritto in giapponese | Registrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondi | Mono | mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 1460 Maschio 1221 Sconosciuto 194 | Contatti | |
Kannada_CC_8 | kannada | Kannada (in cantiere) | kn_IN | Call center | 60 | Kannada (In Pipeline) Dati del call center | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contatti | ||||
Kannada_GC | kannada | Kannada (in cantiere) | kn_IN | Conversazione generale | 100 | Kannada (In Pipeline) Dati di conversazione generale | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contatti | ||||
Kannada_MA | kannada | Kannada (in cantiere) | kn_IN | Audio multimediale | 40 | Kannada (In Pipeline) Dati audio multimediali | Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti | Approvvigionamento Web | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contatti | ||||
Coreano_CC_8 | Coreano | Coreano | ko_KR | 8 kHz | Call center | 107 | Dati del call center coreano | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, | Doppio | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 1086, Maschio 210, Sconosciuto 4 | Contatti | |
Coreano_MA_16 | Coreano | Coreano | ko_KR | 16 kHz | Audio multimediale | 204 | Dati audio multimediali coreani | Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti | Mono | Approvvigionamento Web | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 70 Maschio 303, Sconosciuto 25 | Contatti | |
Coreano_SM_48 | Coreano | Coreano | ko-KR | 48 kHz | Monologo sceneggiato | 1,955 | Monologo scritto in coreano | Registrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondi | Mono | mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 1195 Maschio 1134 Sconosciuto 122 | Contatti | |
malese_GC_8 | Malay | Malay | ms_MIO | 8 kHz | Conversazione generale | 266 | Dati di conversazione generale malese | Conversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti, malese in Malesia | Doppio | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 316, Maschio 176 , Sconosciuto 0 | Contatti | |
Malese_MA_16 | Malay | Malay | ms_MIO | 16 kHz | Audio multimediale | 344 | Dati audio multimediali malesi | Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti | Mono | Approvvigionamento Web | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 236, Maschio 626, Sconosciuto 47 | Contatti | |
Malayalam_CC_8 | Malayalam | Malayalam (in cantiere) | ml_IN | Call center | 60 | Dati del call center Malayalam (In Pipeline). | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contatti | ||||
Malayalam_GC | Malayalam | Malayalam (in cantiere) | ml_IN | Conversazione generale | 100 | Malayalam (In Pipeline) Dati di conversazione generale | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contatti | ||||
Malayalam_MA | Malayalam | Malayalam (in cantiere) | ml_IN | Audio multimediale | 40 | Malayalam (In Pipeline) Dati audio multimediali | Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti | Approvvigionamento Web | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contatti | ||||
Marathi_CC_8 | marathi | Marathi (in cantiere) | signor_IN | Call center | 60 | Dati del call center Marathi (in pipeline). | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contatti | ||||
Marathi_GC | marathi | Marathi (in cantiere) | signor_IN | Conversazione generale | 100 | Dati di conversazione generale Marathi (In Pipeline). | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contatti | ||||
Marathi_MA | marathi | Marathi (in cantiere) | signor_IN | Audio multimediale | 40 | Marathi (In Pipeline) Dati audio multimediali | Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti | Approvvigionamento Web | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contatti | ||||
Messicano_SM_48 | Spagnolo (Messico) | Spagnolo (Messico) | it-MX | 48 kHz | Monologo sceneggiato | 1,492 | Monologo scritto in spagnolo messicano | Registrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondi | Mono | mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 1016 Maschio 1069 Sconosciuto 95 | Contatti | |
Paesi Bassi_SM_48 | Olandese | Olandese | nl-NL | 48 kHz | Monologo sceneggiato | 1,205 | Monologo scritto in olandese | Registrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondi | Mono | mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 1285 Maschio 531 Sconosciuto 3 | Contatti | |
New York inglese_CC_8 | Inglese di New York | Inglese di New York | it_IT | 8 kHz | Call center | 103 | Dati del call center inglese di New York | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, | Doppio | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 610, Maschio 532, Sconosciuto 0 | Contatti | |
Inglese di New York_GC_8 | Inglese di New York | Inglese di New York | it_IT | 8 kHz | Conversazione generale | 107 | Dati di New York English General Conversation | Conversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti, | Doppio | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 118, Maschio 114, Sconosciuto 0 | Contatti | |
Inglese di New York_MA_16 | Inglese di New York | Inglese di New York | it_IT | 16 kHz | Audio multimediale | 140 | Dati audio di New York English Media | Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti | Mono | Approvvigionamento Web | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 66, Maschio 230, Sconosciuto 11 | Contatti | |
Nuova Zelanda_GC_8 | Nuova Zelanda inglese | Nuova Zelanda inglese | it_NZ | 8 kHz | Conversazione generale | 148 | Dati di conversazione generale in inglese neozelandese | Conversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti, | Doppio | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 167, maschio 121, sconosciuto 4 | Contatti | |
Nuova Zelanda_MA_16 | Nuova Zelanda inglese | Nuova Zelanda inglese | it_NZ | 16 kHz | Audio multimediale | 400 | Audio multimediale inglese neozelandese | Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti | Mono | Approvvigionamento Web | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 367, maschio 678, sconosciuto 26 | Contatti | |
Oriya_CC_8 | Oriya | Oriya (in cantiere) | o_IN | Call center | 60 | Oriya (In Pipeline) Dati del call center | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contatti | ||||
Oriya_GC | Oriya | Oriya (in cantiere) | o_IN | Conversazione generale | 100 | Dati di conversazione generale Oriya (In Pipeline). | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contatti | ||||
Oriya_MA | Oriya | Oriya (in cantiere) | o_IN | Audio multimediale | 40 | Oriya (In Pipeline) Dati audio multimediali | Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti | Approvvigionamento Web | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contatti | ||||
Polacco_MA_16 | Polacco | Polacco | pl_PL | 16 kHz | Audio multimediale | 269 | Audio multimediale polacco | Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti | Mono | Approvvigionamento Web | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 173 Maschio 354 Sconosciuto 6 | Contatti | |
Polacco Polonia_SM_48 | Polacco (Polonia) | Polacco (Polonia) | pl-PL | 48 kHz | Monologo sceneggiato | 1,482 | Polonia polacca - Monologo sceneggiato | Registrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondi | Mono | mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 1324 Maschio 701 Sconosciuto 24 | Contatti | |
Punjabi_CC_8 | punjabi | Punjabi (in cantiere) | punjabi | Call center | 60 | Punjabi (In Pipeline) Dati del call center | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contatti | ||||
Punjabi_GC | punjabi | Punjabi (in cantiere) | punjabi | Conversazione generale | 100 | Punjabi (In Pipeline) Dati di conversazione generale | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contatti | ||||
Punjabi_MA | punjabi | Punjabi (in cantiere) | punjabi | Audio multimediale | 40 | Punjabi (In Pipeline) Dati audio multimediali | Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti | Approvvigionamento Web | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contatti | ||||
Russo_SM_48 | Russo | Russo | RU-RU | 48 kHz | Monologo sceneggiato | 2,398 | Monologo scritto in russo | Registrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondi | Mono | mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 1689 Maschio 1937 Sconosciuto 214 | Contatti | |
Scozzese_GC_8 | scozzese (accento inglese) | scozzese (accento inglese) | it_AB | 8 kHz | Conversazione generale | 292 | Dati di conversazione generale scozzese | Conversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti, | Doppio | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 285, Maschio 260, Sconosciuto 3 | Contatti | |
Singapore_CC_8 | Inglese di Singapore | Inglese di Singapore | it_SG | 8 kHz | Call center | 218 | Dati del Call Center di Singapore | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, | Doppio | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 2139, Maschio 884, Sconosciuto 21 | Contatti | |
Singapore_MA_16 | Inglese di Singapore | Inglese di Singapore | it_SG | 16 kHz | Audio multimediale | 247 | Dati audio di Singapore Media | Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti | Mono | Approvvigionamento Web | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 160, Maschio 455, Sconosciuto 37 | Contatti | |
Inglese sudafricano_CC_8 | inglese sudafricano | inglese sudafricano | it_ZA | 8 kHz | Call center | 261 | Dati del Call Center inglese sudafricano | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, | Doppio | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 1274 , Maschio 935 , Sconosciuto 1 | Contatti | |
Inglese sudafricano_MA_16 | inglese sudafricano | inglese sudafricano | it_ZA | 16 kHz | Audio multimediale | 251 | Dati audio multimediali in inglese sudafricano | Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti | Mono | Approvvigionamento Web | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 235, Maschio 432, Sconosciuto 36 | Contatti | |
Swahili_CC_8 | swahili | swahili | sw_KE | 8 kHz | Call center | 230 | Dati del call center swahili | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, | Doppio | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 611, Maschio 833, Sconosciuto 0 | Contatti | |
Swahili_MA_16 | swahili | swahili | sw_KE | 16 kHz | Audio multimediale | 265 | Dati audio Swahili Media | Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti | Mono | Approvvigionamento Web | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 118, Maschio 493, Sconosciuto 25 | Contatti | |
Svedese_CC_8 | svedese | svedese | sv_SE | 8 kHz | Call center | 250 | Dati del call center svedese | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, | Doppio | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 1581, maschio 727, Sconosciuto 2 | Contatti | |
Svedese_MA_16 | svedese | svedese | sv_SE | 16 kHz | Audio multimediale | 278 | Dati audio dei media svedesi | Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti | Mono | Approvvigionamento Web | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 195, maschio 500, Sconosciuto 21 | Contatti | |
Tamil_CC_8 | tamil | Tamil (in cantiere) | ta_IN | Call center | 60 | Dati del call center tamil (in pipeline). | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contatti | ||||
Tamil_GC | tamil | Tamil (in cantiere) | ta_IN | Conversazione generale | 100 | Tamil (In Pipeline) Dati di conversazione generale | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contatti | ||||
Tamil_MA | tamil | Tamil (in cantiere) | ta_IN | Audio multimediale | 40 | Tamil (In Pipeline) Dati audio multimediali | Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti | Approvvigionamento Web | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contatti | ||||
Telugu_GC_8 | telugu | telugu | te_IN | 8 kHz | Conversazione generale | 553 | Dati di conversazione generale telugu | Conversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti, | Doppio | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 574, Maschio 564, Sconosciuto 0 | Contatti | |
Telugu_MA_16 | telugu | telugu | te_IN | 16 kHz | Audio multimediale | 648 | Telugu Media dati audio | Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti | Mono | Approvvigionamento Web | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 207, Maschio 963, Sconosciuto 2 | Contatti | |
Telugu_CC_8 | telugu | Telugu (in cantiere) | te_IN | Call center | 30 | Telugu (In Pipeline) Dati del call center | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contatti | ||||
Telugu_GC | telugu | Telugu (in cantiere) | te_IN | Conversazione generale | 50 | Telugu (In Pipeline) Dati di conversazione generale | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contatti | ||||
Telugu_MA | telugu | Telugu (in cantiere) | te_IN | Audio multimediale | 20 | Telugu (In Pipeline) Dati audio multimediali | Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti | Approvvigionamento Web | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contatti | ||||
Tailandese_GC_8 | tailandese | tailandese | th_TH | 8 kHz | Conversazione generale | 183 | Conversazione generale tailandese | Conversazione telefonica senza script tra due persone. ca. Durata dell'audio (intervallo) - 15-60 minuti, un registro informale utilizzato tra amici | Doppio | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 338, Maschio 96, Sconosciuto 8 | Contatti | |
Tailandese_MA_8 | tailandese | tailandese | th_TH | 16 kHz | Audio multimediale | 173 | Audio multimediale tailandese | Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti | Mono | Approvvigionamento Web | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 143, Maschio 502, Sconosciuto 26 | Contatti | |
Turchia turca_SM_48 | Turchia turca | Turchia turca | tr-TR | 48 kHz | Monologo sceneggiato | 2,027 | Turchia turca | Registrazioni a enunciazione singola, che tendono a rientrare nell'intervallo da 5 a 30 secondi | Mono | mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 1561 Maschio 1241 Sconosciuto 31 | Contatti | |
Vietnamita_GC_8 | vietnamita | vietnamita | vi_VN | 8 kHz | Conversazione generale | 295 | Dati di conversazione generale vietnamita | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, settentrionale (ad es. Hanoi), centrale e meridionale (ad es. Ho Chi Minh City). | Doppio | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmine 400, maschi 380, Sconosciuti 2 | Contatti | |
Vietnamita_MA_16 | vietnamita | vietnamita | vi_VN | 16 kHz | Audio multimediale | 257 | Dati audio dei media vietnamiti | Concedibile in licenza File audio/video di pubblico dominio come interviste, podcast, ecc. - Da 1 a 5 persone. ca. Durata dell'audio (intervallo) 15-60 minuti | Mono | Approvvigionamento Web | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmine 249, maschi 200, Sconosciuti 45 | Contatti | |
Gallese_GC_8 | Gallese (accento inglese) | Gallese (accento inglese) | it_WL | 8 kHz | Conversazione generale | 278 | Dati di conversazione generale gallese | Conversazione telefonica sintetica senza script tra "agente" e "cliente", ca. Durata dell'audio (intervallo) 5-15 minuti, | Doppio | Desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Femmina 270, Maschio 324, Sconosciuto 0 | Contatti | |
Inglese britannico_WW_16 | Inglese britannico | Inglese britannico | it_uk | 16 kHz | Wake Word | 200 Altoparlanti | Sveglia parola inglese britannico | frasi chiave raccolta di dati
| canale 1 | mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Sesso: 50% maschi, 50% femmine, +/- 10%. | Contatti |
Servizi offerti
La raccolta di dati audio da parte di esperti non è pratica per le configurazioni AI complete. Da Shaip, puoi anche considerare i seguenti servizi per rendere i modelli molto più diffusi del solito:
Raccolta di dati di testo
Servizi
Il vero valore dei servizi di raccolta di dati cognitivi Shaip ĆØ che forniscono alle organizzazioni la chiave per sbloccare le informazioni critiche che si trovano all'interno di dati non strutturati
Servizi di raccolta dati di immagini
Assicurati che il tuo modello di visione artificiale identifichi accuratamente ogni immagine, per addestrare senza problemi i modelli di intelligenza artificiale di prossima generazione del futuro
Servizi di raccolta dati video
Ora concentrati sulla visione artificiale insieme alla PNL per addestrare i tuoi modelli a identificare oggetti, individui, deterrenti e altri elementi visivi alla perfezione
Risorse consigliate
Offerta
Annotazione audio per IA intelligenti
I servizi di annotazione audio sono stati un punto di forza di Shaip sin dall'inizio. Sviluppa, addestra e migliora l'IA conversazionale, i chatbot e i motori di riconoscimento vocale con i nostri servizi di annotazione audio all'avanguardia.
Guida all'acquirente
Guida all'acquisto: Guida completa all'IA conversazionale
Il chatbot con cui hai conversato funziona su un avanzato sistema di intelligenza artificiale conversazionale che viene addestrato, testato e costruito utilizzando tonnellate di set di dati di riconoscimento vocale.
Catalogo dati
Catalogo e licenze di dati vocali pronti all'uso
Esiste un'ampia varietĆ di applicazioni comuni per i dati vocali nei progetti di intelligenza artificiale. Ti offriamo grandi quantitĆ di dati di alta qualitĆ pronti per il tuo riconoscimento vocale.
Vuoi creare il tuo set di dati audio?
Connettiti con il nostro esperto di raccolta dati vocale interno per configurare un repository audio che si adatta meglio alle tue esigenze
Domande frequenti (FAQ)
La raccolta dei dati vocali per un modello ML si riferisce al processo di raccolta delle registrazioni audio della lingua parlata. Questa raccolta aiuta nella formazione e nel perfezionamento degli algoritmi di apprendimento automatico, in particolare quelli incentrati sulla comprensione e l'elaborazione delle voci umane.
Quando intendi raccogliere dati audio per il riconoscimento vocale automatico (ASR), dovresti iniziare definendo le esigenze specifiche del tuo progetto, inclusa la lingua, l'accento e il tipo di discorso desiderati. Dopo aver impostato questi parametri assicurati di ottenere tutte le autorizzazioni necessarie per rispettare la privacy dell'utente. Quindi, utilizzare dispositivi di registrazione o software appropriati per acquisire campioni audio chiari. Ogni registrazione dovrebbe essere meticolosamente annotata con la sua trascrizione o altri metadati pertinenti e archiviata sistematicamente per un accesso semplice.
Un set di dati vocali nell'apprendimento automatico ĆØ fondamentale per l'addestramento, il test e la convalida di modelli su misura per riconoscere, trascrivere o interpretare il linguaggio parlato. Tali set di dati aprono la strada a una miriade di applicazioni, dagli assistenti vocali e servizi di trascrizione alla biometria vocale.
Per raccogliere dati precisi da diverse lingue e accenti, è vitale la collaborazione con madrelingua del background linguistico desiderato. Puntare a un campione vario e rappresentativo per coprire un ampio spettro di sfumature demografiche. Impiegare apparecchiature di registrazione standardizzate in ambienti uniformi per garantire la coerenza audio. E, cosa più importante, annota ogni dato con trascrizioni e metadati dettagliati, che denotano la lingua e l'accento specifici.