Ora prendi SCONTO DEL 50* sui set di dati pronti all'uso dell'intelligenza artificiale conversazionale
Set di dati vocali e audio per chatbot, assistenti vocali, dispositivi abilitati alla voce.
*Offerta per un periodo limitato
Scelto dai leader del settore
Dettagli | Parola chiave | Set di dati linguistici standard | Conversazioni al call center 8khz* | Conversazioni generiche 8khz* | Multimedia e podcast 16khz* | Espressione/Monologo scritto 16khz* | Volume totale in ore | Dialetti coperti | Formato Audio | Formato di trascrizione del testo | Usa caso | Fonte | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
afrikaans | Set di dati audio afrikaans | 600 | 900 | 1500 | Afrikaans parlato in Africa | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | |||
Arabo | Set di dati audio arabo | 800 | 1500 | 2300 | Arabo dei paesi del Golfo | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | |||
Cinese | Set di dati audio cinese | 2000 | 2000 | Cinese dalla Cina | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | ||||
Danese | Set di dati audio danese | 400 | 600 | 2000 | 3000 | Danese dalla Danimarca | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | ||
Olandese | Set di dati audio olandese | 2000 | 2000 | Olandese dai Paesi Bassi | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | ||||
Inglese - Accento AAVE | Inglese - Set di dati audio AAVE (inglese vernacolare afroamericano). | 500 | 500 | 1000 | La varietà vernacolare (a volte nota come AAVE, tipicamente parlata dalla stragrande maggioranza degli afroamericani della classe operaia e media) e la varietà più standard (tipicamente parlata dagli afroamericani della classe media in situazioni formali e pubbliche) ma con un'enfasi maggiore sul volgare. | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | |||
Inglese: accento di Boston/New York | Inglese: set di dati audio di Boston/New York | 225 | 225 | 350 | 800 | Si tratta di una raccolta di diversi accenti regionali parlati dentro e intorno alle città di Boston, New York e Filadelfia. Questi accenti potrebbero sembrare simili a quelli dei non locali, ma distinti dagli altri accenti americani. Nonostante alcuni vocaboli locali siano diversi da quelli di altre parti del mondo anglofono, questi accenti sono mutuamente comprensibili con l’inglese parlato altrove. | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | ||
Inglese - Accento cinese | Set di dati audio inglese - cinese accentato | 150 | 300 | 450 | Parlanti che parlano cinese come prima lingua e che si sono trasferiti/immigrati negli Stati Uniti da adolescenti/adulti e hanno imparato l'inglese come seconda lingua. | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | |||
Inglese: accento del profondo sud | Inglese - Set di dati audio del profondo sud | 275 | 275 | 450 | 1000 | Relatori provenienti da (i) Texas; (ii) Carolina del Nord, Carolina del Sud, Georgia; (iii) New Orleans; (iv) Panhandle della Florida; (v) Tennessee, Arkansas, Michigan. | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | ||
Inglese - Accento ispanico | Inglese: set di dati audio con accento ispanico | 400 | 400 | 800 | L'inglese ispanico si riferisce alle varietà di inglese americano parlate da ispanici americani di diverso patrimonio nazionale. L'attenzione principale era rivolta ai messicani americani, parlanti di diverse origini nazionali (ad esempio Messico, Porto Rico, Repubblica Dominicana, Ecuador, Cuba, ecc.) e anche da diverse regioni (ad esempio California, New York, Florida). I relatori inclusi erano quelli che parlano spagnolo come prima lingua così come i parlanti di origine ispanica che parlano lo spagnolo come lingua ereditaria. | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | |||
Inglese - Accento neozelandese | Inglese: set di dati audio della Nuova Zelanda | 250 | 750 | 1000 | Parlanti su entrambe le isole, incluso un mix di parlanti più giovani (<40 anni) e parlanti più anziani (>40 anni) in proporzioni uguali. | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | |||
Inglese - Accento di Singapore | Inglese: set di dati audio di Singapore | 400 | 600 | 1000 | Sia l'inglese standard di Singapore che l'inglese colloquiale di Singapore. Singaporeani di diversa origine etnica (ad esempio cinese, malese, indiana, ecc.) e con diversi livelli di istruzione. | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | |||
Inglese - Accento del Sud Africa | Inglese: set di dati audio del Sud Africa | 400 | 600 | 1000 | Rappresentanti di varie classi socioeconomiche e background etnologici (ad esempio sudafricani di origine europea, africana, indiana o mista). | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | |||
Inglese - Accento irlandese | Set di dati audio inglese - irlandese | 500 | 500 | Inglese parlato in Irlanda | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | ||||
Inglese - Accento scozzese | Inglese - Set di dati audio scozzese | 800 | 800 | Inglese parlato da scozzesi | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | ||||
Inglese - Accento gallese | Inglese: set di dati audio gallese | 800 | 800 | inglese gallese | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | ||||
canadese francese | Set di dati audio franco-canadesi | 1000 | 1000 | Francese canadese | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | ||||
ebraico | Set di dati audio ebraico | 750 | 750 | 1500 | Ebraico in Israele | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | |||
Indonesiano | Set di dati audio indonesiani | 1000 | 1000 | 2000 | indonesiano bahasa | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | |||
Giapponese | Set di dati audio giapponese | 2000 | 2000 | Giapponese dal Giappone | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | ||||
Coreano | Set di dati audio coreano | 100 | 200 | 1500 | 1800 | Gli oratori si diffusero in tutta la Corea del Sud. | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | ||
Malay | Set di dati audio malese | 500 | 500 | 1000 | Malese in Malesia | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | |||
Spagnolo messicano | Set di dati audio spagnolo messicano | 1250 | 1250 | Messicano dal Messico | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | ||||
Polacco | Set di dati audio polacco | 250 | 2000 | 2250 | Polacco dalla Polonia | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | |||
Russo | Set di dati audio russo | 2000 | 2000 | Russo dalla Russia | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | ||||
swahili | Set di dati audio swahili | 350 | 650 | 1000 | Swahili sudafricano e keniano | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | |||
svedese | Set di dati audio svedese | 350 | 650 | 1000 | Svedese in Svezia | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | |||
cinese di Taiwan | Set di dati audio cinese di Taiwan | 1000 | 1000 | Cinese di Taiwan | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | ||||
tailandese | Set di dati audio tailandesi | 350 | 450 | 800 | Un registro informale utilizzato tra amici, | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | |||
Turco | Set di dati audio turco | 2000 | 2000 | Turco dalla Turchia | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | ||||
vietnamita | Set di dati audio vietnamiti | 600 | 400 | 1000 | Settentrionale (ad esempio, Hanoi), Centrale e Meridionale (ad esempio, Ho Chi Minh City). | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | |||
Hindi | Set di dati audio hindi | 800 | 2000 | 2800 | Hindi in India, in particolare nelle regioni del nord, dell'est e dell'ovest | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | |||
Hinglish | Set di dati audio inglese indiano | 300 | 500 | 800 | Raccolti dalle città urbane indiane che sono centri finanziari del paese a causa delle crescenti opportunità economiche. Tali luoghi possono essere Noida, Delhi, Dehradun, Chandigarh, Mumbai, Calcutta, Bangalore, Pune, Chennai, Hyderabad, ecc. | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | |||
Inglese | Set di dati audio in inglese | 700 | 700 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | |||||
kannada | Set di dati audio Kannada | 60 | 100 | 40 | 200 | Kannada del Karnataka, India | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | ||
Malayalam | Set di dati audio malayalam | 60 | 100 | 40 | 200 | Malayalam del Kerala, Lakshadweep e Puducherry | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | ||
Oriya | Set di dati audio Oriya | 60 | 100 | 40 | 200 | Oriya da parti di Odisha, Bengala occidentale, Jharkhand e Chhattisgarh | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | ||
punjabi | Set di dati audio punjabi | 60 | 100 | 40 | 200 | Punjabi del Punjab, India | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | ||
tamil | Set di dati audio tamil | 60 | 100 | 240 | 400 | Tamil del Tamil Nadu, India | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | ||
telugu | Set di dati audio telugu | 100 | 950 | 950 | 2000 | Telugu dell'Andhra Pradesh, India | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | ||
Bengalese | Set di dati audio bengalese | 60 | 100 | 40 | 200 | Bengalese del Bengala Occidentale, India | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | ||
Gujarati | Set di dati audio gujarati | 60 | 100 | 40 | 200 | Gujarati dal Gujarat, India | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | ||
marathi | Set di dati audio Marathi | 60 | 100 | 40 | 200 | Marathi del Maharashtra, India | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti | ||
Assamese | Set di dati audio assamese | 60 | 100 | 40 | 200 | Assamese dell'Assam, India | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Saip | Contatti Contatti |
Profonda esperienza nell'IA conversazionale
L'IA conversazionale o i chatbot o gli assistenti virtuali/digitali sono intelligenti quanto la tecnologia e i dati dietro di essi. In Shaip, ti offriamo un'ampia serie di set di dati audio diversificati per l'elaborazione del linguaggio naturale (NLP) che imitano le conversazioni con persone reali e ti consentono di dare vita alla tua intelligenza artificiale. Grazie alla nostra profonda comprensione, ti aiutiamo a creare e localizzare modelli vocali abilitati all'intelligenza artificiale, con la massima precisione con set di dati ricchi e strutturati in più lingue da tutto il mondo. Offriamo servizi di raccolta audio multilingue, trascrizione audio e annotazione audio in base alle tue esigenze, personalizzando completamente l'intento, le espressioni e la distribuzione demografica desiderati.
Raccolta di discorsi con script
Raccolta di discorsi spontanei
Trascrizione di dati audio
Etichettatura e annotazione dei dati
Shaip ti consente di addestrare accuratamente la tua piattaforma di intelligenza artificiale conversazionale in modo che possa:
- Parla, invia messaggi e chatta senza interruzioni su più canali.
- Impara dalle interazioni esistenti sotto forma di chat, trascrizioni vocali, transazioni, ecc. e suggerisci e conversa, sulla base di questi apprendimenti.
- Comprendere l'intento dietro il linguaggio umano e rimuovere l'ambiguità nella comprensione del linguaggio umano.
- Interagisci con te su base individuale e può essere addestrato a identificare gli utenti e ricordare le conversazioni passate.
Un leader mondiale nei dati di formazione sull'IA conversazionale
Ore di dati audio in oltre 100 lingue: sorgente, trascritto e annotato
Licenze per dati vocali
Oltre 20 ore di dati vocali in oltre 40 lingue e dialetti che coprono una gamma di oltre 55 argomenti di diversi domini, ad esempio call center, dibattiti, conversazioni generali, discorsi, podcast, ecc.
Raccolta dati vocali
Raccogli dati audio e vocali (monologo, conversazione a 2 persone, chat umano-bot) in oltre 100 lingue da tutto il mondo, personalizzati in base alle tue esigenze di intelligenza artificiale.
Trascrizione dei dati del parlato
Trascrizione audio o annotazione audio economicamente vantaggiosa attraverso una forte forza lavoro di 30,000 collaboratori con TAT, accuratezza e risparmio garantiti
Accelera lo sviluppo di app di intelligenza artificiale conversazionale con i servizi di raccolta audio e annotazione audio
Il vantaggio Shaip
Scala​
Siamo in grado di acquisire, ridimensionare e fornire dati audio da tutto il mondo in più lingue e dialetti in base alle tue esigenze.
Indipendente
Abbiamo la giusta esperienza in materia di raccolta di dati, trascrizione e annotazione gold standard accurati e imparziali.
Network NetPoulSafe
Una rete di oltre 30,000 collaboratori qualificati, a cui possono essere assegnate rapidamente attività di raccolta dati per creare modelli di formazione AI e servizi di scale-up.
Tecnologia
Disponiamo di una piattaforma completamente basata sull'intelligenza artificiale con strumenti e processi proprietari per sfruttare la gestione del flusso di lavoro 24 ore su 7, XNUMX giorni su XNUMX.
AgilitÃ
Ci adattiamo molto rapidamente ai cambiamenti nelle esigenze dei clienti e aiutiamo ad accelerare lo sviluppo dell'intelligenza artificiale con dati vocali di qualità 5-10 volte più veloci rispetto alla concorrenza.
Sicurezza
Diamo la massima importanza alla sicurezza e alla privacy dei dati e siamo anche certificati per gestire dati sensibili altamente regolamentati.
Cosa sappiamo fare meglio
Dati di allenamento
Ottieni dati etichettati della massima qualità in una frazione del tempo. È lo standard di riferimento, affidabile e pronto per addestrare i tuoi modelli di intelligenza artificiale e ML per raggiungere i massimi livelli di prestazioni.
Raccolta dati, etichettatura e annotazione
Con Shaip ottieni oltre 15 anni di comprovata esperienza nella raccolta, trascrizione e annotazione di dati di qualità . Con la nostra forza lavoro globale possiamo raccogliere dati da tutto il mondo, quindi fornire servizi di etichettatura e annotazione con la quantità perfetta di livello di abilità e competenza richiesta per i tuoi dati.
Cataloghi di dati e licenze
Con il nostro vasto inventario di milioni di set di dati puoi raccogliere e organizzare come richiesto. Possiamo quindi concedere in licenza quei dati di qualità per i tuoi specifici requisiti di utilizzo di IA e ML. Inoltre, questi dati sono disponibili a una frazione del costo se dovessi crearli tu stesso.
Vuoi creare il tuo set di dati?
Contattaci ora per scoprire come possiamo raccogliere un set di dati personalizzato per la tua soluzione di intelligenza artificiale unica.