Caso di studio: raccolta di enunciati

Fornito oltre 7 milioni di espressioni per creare assistenti digitali multilingue in 13 lingue

Raccolta di espressioni

Soluzione del mondo reale

Dati che alimentano le conversazioni globali

La necessità di formazione sull'espressione sorge perché non tutti i clienti usano le parole o le frasi esatte mentre interagiscono o fanno domande ai propri assistenti vocali in un formato con script. Ecco perché le applicazioni vocali specifiche devono essere addestrate su dati vocali spontanei. Ad esempio, "Dove si trova l'ospedale più vicino?" "Trova un ospedale vicino a me" o "C'è un ospedale nelle vicinanze?" tutti indicano lo stesso intento di ricerca ma sono formulati in modo diverso.

Raccolta di espressioni1

Problema

Per eseguire la roadmap vocale dell'Assistente digitale dei clienti per le lingue di tutto il mondo, il team doveva acquisire grandi volumi di dati di formazione per il modello AI di riconoscimento vocale. I requisiti critici del cliente erano:

  • Acquisisci grandi volumi di dati di addestramento (promemoria di pronuncia di un singolo oratore non più lunghi di 3-30 secondi) per servizi di riconoscimento vocale in 13 lingue globali
  • Per ciascuna lingua, il fornitore genererà delle richieste di testo per la registrazione da parte dei relatori (a meno che il
    forniture del cliente) e trascrivere l'audio risultante.
  • Fornisci dati audio e trascrizione di enunciati registrati con i file JSON corrispondenti
    contenente i metadati per tutte le registrazioni.
  • Garantire un mix diversificato di parlanti per età, sesso, istruzione e dialetto
  • Garantire un mix diversificato di ambienti di registrazione secondo le specifiche.
  • Ciascuna registrazione audio deve essere di almeno 16 kHz ma preferibilmente di 44 kHz

Accelera la tua IA conversazionale
sviluppo di applicazioni del 100%

“Dopo aver valutato molti fornitori, il cliente ha scelto Shaip per la loro esperienza nei progetti di IA conversazionale. Siamo rimasti colpiti dalla competenza di Shaip nell'esecuzione del progetto, dalla sua esperienza nel reperire, trascrivere e fornire le espressioni richieste da linguisti esperti in 13 lingue entro scadenze rigorose e con la qualità richiesta”

Soluzione

Grazie alla nostra profonda conoscenza dell'IA conversazionale, abbiamo aiutato il cliente a raccogliere, trascrivere e annotare i dati con un team di esperti linguisti e annotatori per addestrare la loro suite vocale multilingue basata sull'elaborazione vocale basata sull'intelligenza artificiale.

L'ambito del lavoro per Shaip includeva, ma non si limitava, all'acquisizione di grandi volumi di dati di addestramento audio per il riconoscimento vocale, alla trascrizione di registrazioni audio in più lingue per tutte le lingue della nostra roadmap linguistica di livello 1 e di livello 2 e alla fornitura di corrispondenti JSON file contenenti i metadati. Shaip ha raccolto espressioni di 3-30 secondi su larga scala, pur mantenendo i livelli di qualità desiderati necessari per addestrare modelli ML per progetti complessi.

  • Audio raccolto, trascritto e annotato: 22,250 ore
  • Lingue supportate: 13 (danese, coreano, arabo saudita, olandese, cinese continentale e taiwanese, francese canadese, spagnolo messicano, turco, hindi, polacco, giapponese, russo)
  • N. di espressioni: 7+
  • Timeline: mesi 7-8

Suite vocale multilingue per l'elaborazione vocale basata sull'intelligenza artificiale

Durante la raccolta di enunciati audio a 16 kHz, abbiamo assicurato un sano mix di parlanti per età, sesso, istruzione e dialetti in diversi ambienti di registrazione.

Risultato

I dati audio di alta qualità delle espressioni di linguisti esperti hanno consentito al cliente di addestrare accuratamente il proprio modello di riconoscimento vocale multilingue in 13 lingue globali di livello 1 e 2. Con set di dati di addestramento gold standard, il cliente può offrire un'assistenza digitale intelligente e solida per risolvere i futuri problemi del mondo reale.

Dati audio delle espressioni di alta qualità

La nostra competenza

Ore di discorso raccolte
0 +
Team di raccoglitori di dati vocali
0
Conforme alle PII
0 %
Numero fantastico
0 +
Accettazione e accuratezza dei dati
> 0
Clientela Fortune 500
0 +

Raccontaci come possiamo aiutarti con la tua prossima iniziativa di intelligenza artificiale.