Set di dati hindi
हिंदी डेटासेट
Set di dati di alta qualità per call center, conversazioni generali e podcast in hindi per modelli di intelligenza artificiale e ASR
Panoramica
Titolo (Lingua)
Set di dati in lingua hindi
Tipi di set di dati
Call Center, Conversazione generale, Media (Podcast), Monologo sceneggiato
Paese
India
Descrizione
Sono disponibili conversazioni telefoniche non sceneggiate tra due persone, della durata compresa tra 15 e 60 minuti, insieme a file audio o video di pubblico dominio concessi in licenza, come interviste e podcast, con un numero di partecipanti compreso tra 1 e 5. Inoltre, le registrazioni di singole frasi durano in genere dai 5 ai 30 secondi, e sono disponibili anche dati di monologhi sceneggiati.
Usa caso
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Dettagli del set di dati
| Tipo di set di dati | Frequenza di campionamento | RELATORI | canale | Ore totali | Numero totale di oratori |
|---|---|---|---|---|---|
| Call Centers | 8 kHz | 2 Altoparlanti | Doppio | 70:45:51 | su richiesta |
| Call Centers | 8 kHz | 2 Altoparlanti | Mono | 20,000:00:00 | su richiesta |
| Call Centers | 16 kHz | 2 Altoparlanti | Mono | 29:17:20 | 261 |
| Call Centers | 16 kHz | 2 Altoparlanti | Doppio | 400:27:10 | 1200 |
| Conversazione generale | 8 kHz | 2 Altoparlanti | Doppio | 47:48:40 | 224 |
| Dati multimediali | 16 kHz | Più altoparlanti | Mono | 227:57:43 | 438 |
| Monologo sceneggiato | 48 kHz | Altoparlante singolo | Mono | 2,866:00:00 | 3,988 |
| Monologo sceneggiato | 24 kHz | Altoparlante singolo | Mono | 29,000:00:00 | su richiesta |
Clienti in primo piano
Consentire ai team di creare prodotti di intelligenza artificiale leader a livello mondiale.
Non riesci a trovare quello che stai cercando?
Nuovi set di dati pronti all'uso vengono raccolti in tutti i tipi di dati
Contattaci ora per lasciar andare le tue preoccupazioni relative alla raccolta dei dati di formazione audio/vocale