Caso di studio: raccolta di enunciati
Fornito oltre 7 milioni di espressioni per creare assistenti digitali multilingue in 13 lingue
Soluzione del mondo reale
Dati che alimentano le conversazioni globali
La necessità di formazione sull'espressione sorge perché non tutti i clienti usano le parole o le frasi esatte mentre interagiscono o fanno domande ai propri assistenti vocali in un formato con script. Ecco perché le applicazioni vocali specifiche devono essere addestrate su dati vocali spontanei. Ad esempio, "Dove si trova l'ospedale più vicino?" "Trova un ospedale vicino a me" o "C'è un ospedale nelle vicinanze?" tutti indicano lo stesso intento di ricerca ma sono formulati in modo diverso.
Problema
Per eseguire la roadmap vocale dell'Assistente digitale dei clienti per le lingue di tutto il mondo, il team doveva acquisire grandi volumi di dati di formazione per il modello AI di riconoscimento vocale. I requisiti critici del cliente erano:
- Acquisisci grandi volumi di dati di addestramento (promemoria di pronuncia di un singolo oratore non più lunghi di 3-30 secondi) per servizi di riconoscimento vocale in 13 lingue globali
- Per ciascuna lingua, il fornitore genererà delle richieste di testo per la registrazione da parte dei relatori (a meno che il
forniture del cliente) e trascrivere l'audio risultante. - Fornisci dati audio e trascrizione di enunciati registrati con i file JSON corrispondenti
contenente i metadati per tutte le registrazioni. - Garantire un mix diversificato di parlanti per età, sesso, istruzione e dialetto
- Garantire un mix diversificato di ambienti di registrazione secondo le specifiche.
- Ciascuna registrazione audio deve essere di almeno 16 kHz ma preferibilmente di 44 kHz
“Dopo aver valutato molti fornitori, il cliente ha scelto Shaip per la loro esperienza nei progetti di IA conversazionale. Siamo rimasti colpiti dalla competenza di Shaip nell'esecuzione del progetto, dalla sua esperienza nel reperire, trascrivere e fornire le espressioni richieste da linguisti esperti in 13 lingue entro scadenze rigorose e con la qualità richiesta”
Soluzione
Grazie alla nostra profonda conoscenza dell'IA conversazionale, abbiamo aiutato il cliente a raccogliere, trascrivere e annotare i dati con un team di esperti linguisti e annotatori per addestrare la loro suite vocale multilingue basata sull'elaborazione vocale basata sull'intelligenza artificiale.
L'ambito del lavoro per Shaip includeva, ma non si limitava, all'acquisizione di grandi volumi di dati di addestramento audio per il riconoscimento vocale, alla trascrizione di registrazioni audio in più lingue per tutte le lingue della nostra roadmap linguistica di livello 1 e di livello 2 e alla fornitura di corrispondenti JSON file contenenti i metadati. Shaip ha raccolto espressioni di 3-30 secondi su larga scala, pur mantenendo i livelli di qualità desiderati necessari per addestrare modelli ML per progetti complessi.
- Audio raccolto, trascritto e annotato: per 22,250 ore
- Lingue supportate: 13 (danese, coreano, arabo saudita, olandese, cinese continentale e taiwanese, francese canadese, spagnolo messicano, turco, hindi, polacco, giapponese, russo)
- N. di espressioni: 7+
- Timeline: mesi 7-8
Durante la raccolta di enunciati audio a 16 kHz, abbiamo assicurato un sano mix di parlanti per età, sesso, istruzione e dialetti in diversi ambienti di registrazione.
Risultato
I dati audio di alta qualità delle espressioni di linguisti esperti hanno consentito al cliente di addestrare accuratamente il proprio modello di riconoscimento vocale multilingue in 13 lingue globali di livello 1 e 2. Con set di dati di addestramento gold standard, il cliente può offrire un'assistenza digitale intelligente e solida per risolvere i futuri problemi del mondo reale.
La nostra competenza
Risorse consigliate
Guida all'acquirente
Guida all'acquisto: IA conversazionale
Il chatbot con cui hai conversato funziona su un avanzato sistema di intelligenza artificiale conversazionale che viene addestrato, testato e costruito utilizzando tonnellate di set di dati di riconoscimento vocale.
Blog
Lo stato dell'IA conversazionale 2021
Le infografiche AI 2021 Conversazionale parlano di cos'è l'IA Conversazionale, la sua evoluzione, i tipi, il mercato IA Conversazionale per regione, i casi d'uso, le sfide, ecc.
Blog
3 ostacoli all'evoluzione dell'IA conversazionale
Shaip sta dando il via all'evoluzione dell'IA conversazionale come strumento di coinvolgimento dei clienti offrendo i dati audio annotati necessari in oltre 50 lingue.
Raccontaci come possiamo aiutarti con la tua prossima iniziativa di intelligenza artificiale.