Ora prendi SCONTO DEL 50* sui set di dati pronti all'uso dell'intelligenza artificiale conversazionale

Set di dati vocali e audio per chatbot, assistenti vocali, dispositivi abilitati alla voce.

*Offerta per un periodo limitato

  • Registrandoti, sono d'accordo con Shaip Informativa sulla Privacy ed Termini di Servizio e fornisco il mio consenso a ricevere comunicazioni di marketing B2B da Shaip.

Scelto dai leader del settore

DettagliSet di dati linguistici standardConversazioni al call center 8khz*Conversazioni generiche 8khz*Multimedia e podcast 16khz*Espressione/Monologo scritto 16khz*Volume totale in oreDialetti copertiFormato AudioFormato di trascrizione del testoUsa casoFonteCTA
DiscorsoafrikaansSet di dati audio afrikaans6009001500Afrikaans parlato in Africa. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsoAraboSet di dati audio arabo80015002300Arabo dei paesi del Golfo. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsoCineseSet di dati audio cinese20002000Cinese dalla Cina. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsoDaneseSet di dati audio danese40060020003000Danese dalla Danimarca. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsoOlandeseSet di dati audio olandese20002000Olandese dai Paesi Bassi. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsoInglese - Accento AAVEInglese - Set di dati audio AAVE (inglese vernacolare afroamericano).5005001000La varietà vernacolare (a volte nota come AAVE, tipicamente parlata dalla stragrande maggioranza degli afroamericani della classe operaia e media) e la varietà più standard (tipicamente parlata dagli afroamericani della classe media in situazioni formali e pubbliche) ma con un'enfasi maggiore sul volgare.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsoInglese: accento di Boston/New YorkInglese: set di dati audio di Boston/New York225225350800Si tratta di una raccolta di diversi accenti regionali parlati dentro e intorno alle città di Boston, New York e Filadelfia. Questi accenti potrebbero sembrare simili a quelli dei non locali, ma distinti dagli altri accenti americani. Nonostante alcuni vocaboli locali siano diversi da quelli di altre parti del mondo anglofono, questi accenti sono mutuamente comprensibili con l’inglese parlato altrove.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsoInglese - Accento cineseSet di dati audio inglese - cinese accentato150300450Parlanti che parlano cinese come prima lingua e che si sono trasferiti/immigrati negli Stati Uniti da adolescenti/adulti e hanno imparato l'inglese come seconda lingua.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsoInglese: accento del profondo sudInglese - Set di dati audio del profondo sud2752754501000Relatori provenienti da (i) Texas; (ii) Carolina del Nord, Carolina del Sud, Georgia; (iii) New Orleans; (iv) Panhandle della Florida; (v) Tennessee, Arkansas, Michigan.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsoInglese - Accento ispanicoInglese: set di dati audio con accento ispanico400400800L'inglese ispanico si riferisce alle varietà di inglese americano parlate da ispanici americani di diverso patrimonio nazionale. L'attenzione principale era rivolta ai messicani americani, parlanti di diverse origini nazionali (ad esempio Messico, Porto Rico, Repubblica Dominicana, Ecuador, Cuba, ecc.) e anche da diverse regioni (ad esempio California, New York, Florida). I relatori inclusi erano quelli che parlano spagnolo come prima lingua così come i parlanti di origine ispanica che parlano lo spagnolo come lingua ereditaria.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsoInglese - Accento neozelandeseInglese: set di dati audio della Nuova Zelanda2507501000Parlanti su entrambe le isole, incluso un mix di parlanti più giovani (<40 anni) e parlanti più anziani (>40 anni) in proporzioni uguali.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsoInglese - Accento di SingaporeInglese: set di dati audio di Singapore4006001000Sia l'inglese standard di Singapore che l'inglese colloquiale di Singapore. Singaporeani di diversa origine etnica (ad esempio cinese, malese, indiana, ecc.) e con diversi livelli di istruzione.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsoInglese - Accento del Sud AfricaInglese: set di dati audio del Sud Africa4006001000Rappresentanti di varie classi socioeconomiche e background etnologici (ad esempio sudafricani di origine europea, africana, indiana o mista).. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsoInglese - Accento irlandeseSet di dati audio inglese - irlandese500500Inglese parlato in Irlanda. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsoInglese - Accento scozzeseInglese - Set di dati audio scozzese800800Inglese parlato da scozzesi. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsoInglese - Accento galleseInglese: set di dati audio gallese800800inglese gallese. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
Discorsocanadese franceseSet di dati audio franco-canadesi10001000Francese canadese. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsoebraicoSet di dati audio ebraico7507501500Ebraico in Israele. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsoIndonesianoSet di dati audio indonesiani100010002000indonesiano bahasa. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsoGiapponeseSet di dati audio giapponese20002000Giapponese dal Giappone. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsoCoreanoSet di dati audio coreano10020015001800Gli oratori si diffusero in tutta la Corea del Sud.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsoMalaySet di dati audio malese5005001000Malese in Malesia. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsoSpagnolo messicanoSet di dati audio spagnolo messicano12501250Messicano dal Messico. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsoPolaccoSet di dati audio polacco25020002250Polacco dalla Polonia. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsoRussoSet di dati audio russo20002000Russo dalla Russia. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsoswahiliSet di dati audio swahili3506501000Swahili sudafricano e keniano. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsosvedeseSet di dati audio svedese3506501000Svedese in Svezia. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
Discorsocinese di TaiwanSet di dati audio cinese di Taiwan10001000Cinese di Taiwan. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsotailandeseSet di dati audio tailandesi350450800Un registro informale utilizzato tra amici,. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsoTurcoSet di dati audio turco20002000Turco dalla Turchia. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsovietnamitaSet di dati audio vietnamiti6004001000Settentrionale (ad esempio, Hanoi), Centrale e Meridionale (ad esempio, Ho Chi Minh City).. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsoHindiSet di dati audio hindi80020002800Hindi in India, in particolare nelle regioni del nord, dell'est e dell'ovest. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsoHinglishSet di dati audio inglese indiano300500800Raccolti dalle città urbane indiane che sono centri finanziari del paese a causa delle crescenti opportunità economiche. Tali luoghi possono essere Noida, Delhi, Dehradun, Chandigarh, Mumbai, Calcutta, Bangalore, Pune, Chennai, Hyderabad, ecc.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsoIngleseSet di dati audio in inglese700700. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsokannadaSet di dati audio Kannada6010040200Kannada del Karnataka, India. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsoMalayalamSet di dati audio malayalam6010040200Malayalam del Kerala, Lakshadweep e Puducherry. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsoOriyaSet di dati audio Oriya6010040200Oriya da parti di Odisha, Bengala occidentale, Jharkhand e Chhattisgarh. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsopunjabiSet di dati audio punjabi6010040200Punjabi del Punjab, India. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsotamilSet di dati audio tamil60100240400Tamil del Tamil Nadu, India. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsoteluguSet di dati audio telugu1009509502000Telugu dell'Andhra Pradesh, India. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsoBengaleseSet di dati audio bengalese6010040200Bengalese del Bengala Occidentale, India. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsoGujaratiSet di dati audio gujarati6010040200Gujarati dal Gujarat, India. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsomarathiSet di dati audio Marathi6010040200Marathi del Maharashtra, India. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscorsoAssameseSet di dati audio assamese6010040200Assamese dell'Assam, India. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip

Profonda esperienza nell'IA conversazionale

L'IA conversazionale o i chatbot o gli assistenti virtuali/digitali sono intelligenti quanto la tecnologia e i dati dietro di essi. In Shaip, ti offriamo un'ampia serie di set di dati audio diversificati per l'elaborazione del linguaggio naturale (NLP) che imitano le conversazioni con persone reali e ti consentono di dare vita alla tua intelligenza artificiale. Grazie alla nostra profonda comprensione, ti aiutiamo a creare e localizzare modelli vocali abilitati all'intelligenza artificiale, con la massima precisione con set di dati ricchi e strutturati in più lingue da tutto il mondo. Offriamo servizi di raccolta audio multilingue, trascrizione audio e annotazione audio in base alle tue esigenze, personalizzando completamente l'intento, le espressioni e la distribuzione demografica desiderati.

Raccolta di discorsi con script

Raccolta di discorsi spontanei

Trascrizione di dati audio

Etichettatura e annotazione dei dati

Shaip ti consente di addestrare accuratamente la tua piattaforma di intelligenza artificiale conversazionale in modo che possa:

  • Parla, invia messaggi e chatta senza interruzioni su più canali.
  • Impara dalle interazioni esistenti sotto forma di chat, trascrizioni vocali, transazioni, ecc. e suggerisci e conversa, sulla base di questi apprendimenti.
  • Comprendere l'intento dietro il linguaggio umano e rimuovere l'ambiguità nella comprensione del linguaggio umano.
  • Interagisci con te su base individuale e può essere addestrato a identificare gli utenti e ricordare le conversazioni passate.

Un leader mondiale nei dati di formazione sull'IA conversazionale

Ore di dati audio in oltre 100 lingue: sorgente, trascritto e annotato

Licenze per dati vocali

Oltre 20 ore di dati vocali in oltre 40 lingue e dialetti che coprono una gamma di oltre 55 argomenti di diversi domini, ad esempio call center, dibattiti, conversazioni generali, discorsi, podcast, ecc.

Raccolta dati vocali

Raccogli dati audio e vocali (monologo, conversazione a 2 persone, chat umano-bot) in oltre 100 lingue da tutto il mondo, personalizzati in base alle tue esigenze di intelligenza artificiale.

Trascrizione dei dati del parlato

Trascrizione audio o annotazione audio economicamente vantaggiosa attraverso una forte forza lavoro di 30,000 collaboratori con TAT, accuratezza e risparmio garantiti

Accelera lo sviluppo di app di intelligenza artificiale conversazionale con i servizi di raccolta audio e annotazione audio

Il vantaggio Shaip

Scala​

Siamo in grado di acquisire, ridimensionare e fornire dati audio da tutto il mondo in più lingue e dialetti in base alle tue esigenze.

Indipendente

Abbiamo la giusta esperienza in materia di raccolta di dati, trascrizione e annotazione gold standard accurati e imparziali.

Network NetPoulSafe

Una rete di oltre 30,000 collaboratori qualificati, a cui possono essere assegnate rapidamente attività di raccolta dati per creare modelli di formazione AI e servizi di scale-up.

Tecnologia

Disponiamo di una piattaforma completamente basata sull'intelligenza artificiale con strumenti e processi proprietari per sfruttare la gestione del flusso di lavoro 24 ore su 7, XNUMX giorni su XNUMX.

Agilità

Ci adattiamo molto rapidamente ai cambiamenti nelle esigenze dei clienti e aiutiamo ad accelerare lo sviluppo dell'intelligenza artificiale con dati vocali di qualità 5-10 volte più veloci rispetto alla concorrenza.

Sicurezza

Diamo la massima importanza alla sicurezza e alla privacy dei dati e siamo anche certificati per gestire dati sensibili altamente regolamentati.

Cosa sappiamo fare meglio

Dati di allenamento

Ottieni dati etichettati della massima qualità in una frazione del tempo. È lo standard di riferimento, affidabile e pronto per addestrare i tuoi modelli di intelligenza artificiale e ML per raggiungere i massimi livelli di prestazioni.

Scopri di più

Raccolta dati, etichettatura e annotazione

Con Shaip ottieni oltre 15 anni di comprovata esperienza nella raccolta, trascrizione e annotazione di dati di qualità. Con la nostra forza lavoro globale possiamo raccogliere dati da tutto il mondo, quindi fornire servizi di etichettatura e annotazione con la quantità perfetta di livello di abilità e competenza richiesta per i tuoi dati.

Scopri di più

Cataloghi di dati e licenze

Con il nostro vasto inventario di milioni di set di dati puoi raccogliere e organizzare come richiesto. Possiamo quindi concedere in licenza quei dati di qualità per i tuoi specifici requisiti di utilizzo di IA e ML. Inoltre, questi dati sono disponibili a una frazione del costo se dovessi crearli tu stesso.

Scopri di più

Vuoi creare il tuo set di dati?

Contattaci ora per scoprire come possiamo raccogliere un set di dati personalizzato per la tua soluzione di intelligenza artificiale unica.