Visione computerizzata

Oltre 22 set di dati open source più ricercati per la visione artificiale

Un algoritmo AI è buono solo quanto i dati che gli fornisci.

Non è né un'affermazione audace né non convenzionale. L'intelligenza artificiale poteva sembrare piuttosto inverosimile un paio di decenni fa, ma da allora l'intelligenza artificiale e l'apprendimento automatico hanno fatto molta strada.

Visione computerizzata aiuta i computer a comprendere e interpretare etichette e immagini. Quando alleni il tuo computer utilizzando il giusto tipo di immagini, può acquisire la capacità di rilevare, comprendere e identificare varie caratteristiche facciali, rilevare malattie, guidare veicoli autonomi e anche salvare vite utilizzando la scansione multidimensionale degli organi.

Si prevede che il mercato della visione artificiale raggiungerà $ 144.46 miliardi entro il 2028 da un modesto $ 7.04 miliardi nel 2020, crescendo a un CAGR del 45.64% tra il 2021 e il 2028.

Alcuni dei casi d'uso della visione artificiale sono:

  • Imaging medico
  • Veicolo autonomo
  • Riconoscimento facciale e di oggetti
  • Identificazione del difetto
  • Rilevazione della scena

I set di dati di immagini stai alimentando e formando le tue attività di Machine Learning e di visione artificiale sono fondamentali per il successo del tuo progetto di intelligenza artificiale. È piuttosto difficile ottenere un set di dati di qualità. A seconda della complessità del tuo progetto, potrebbero essere necessarie da pochi giorni ad alcune settimane per ottenere set di dati affidabili e pertinenti per scopi di visione artificiale.

Qui ti forniamo una gamma (classificata per comodità) di set di dati open source che puoi utilizzare subito.

Elenco completo di set di dati di visione artificiale

Generale:

  1. IMAGEnet (Collegamento)

    ImageNet è un set di dati ampiamente utilizzato e viene fornito con un sorprendente 1.2 milioni di immagini classificate in 1000 categorie. Questo set di dati è organizzato secondo la gerarchia WorldNet e classificato in tre parti: i dati di addestramento, le etichette delle immagini e i dati di convalida.

  2. Cinetica 700 (Collegamento)

    Kinetics 700 è un enorme set di dati di alta qualità con oltre 650,000 clip di 700 diverse classi di azioni umane. Ciascuna delle azioni collettive ha circa 700 clip video. Le clip nel set di dati hanno interazioni uomo-oggetto e uomo-uomo, che si stanno rivelando molto utili per riconoscere le azioni umane nei video.

  3. CIFAR-10 (Collegamento)

    CIFAR 10 è uno dei più grandi set di dati di computer vision che vanta 60000 immagini a colori 32 x 32 che rappresentano dieci classi diverse. Ogni classe ha circa 6000 immagini utilizzate per addestrare algoritmi di visione artificiale e apprendimento automatico.

Riconoscimento facciale:

Riconoscimento facciale

  1. Volti etichettati in natura (Collegamento)

    Labeled Faced in the Wild è un enorme set di dati contenente più di 13,230 immagini di quasi 5,750 persone rilevate da Internet. Questo set di dati di volti è progettato per semplificare lo studio del rilevamento dei volti senza vincoli.

  2. CASIA WebFace (Collegamento)

    CASIA Web Face è un set di dati ben progettato che aiuta l'apprendimento automatico e la ricerca scientifica sul riconoscimento facciale illimitato. Con oltre 494,000 immagini di quasi 10,000 identità reali, è l'ideale per le attività di identificazione e verifica dei volti.

  3. Set di dati facce UMD (Collegamento)

    UMD deve affrontare un set di dati ben annotato che contiene due parti: immagini fisse e fotogrammi video. Il set di dati ha più di 367,800 annotazioni di volti e 3.7 milioni di fotogrammi video di soggetti annotati.

Riconoscimento della scrittura:

  1. Database MNIST (Collegamento)

    MNIST è un database contenente campioni di cifre scritte a mano da 0 a 9 e dispone di 60,000 e 10,000 immagini di addestramento e test. Rilasciato nel 1999, MNIST semplifica il test dei sistemi di elaborazione delle immagini in Deep Learning.

  2. Set di dati sui personaggi artificiali (Collegamento)

    Artificial Characters Dataset è, come suggerisce il nome, dati generati artificialmente che descrivono la struttura della lingua inglese in dieci lettere maiuscole. Viene fornito con più di 6000 immagini.

Parliamo oggi dei requisiti relativi ai dati di addestramento AI.

Rilevamento di oggetti:

  1. MS COCO (Collegamento)

    MS COCO o Common Objects in Context è un set di dati di rilevamento e sottotitoli di oggetti.

    Dispone di oltre 328,000 immagini con rilevamento di punti chiave, rilevamento di oggetti multipli, sottotitoli e annotazioni con maschera di segmentazione. Viene fornito con 80 categorie di oggetti e cinque didascalie per immagine.

  2. LSOLE(Collegamento)

    LSUN, abbreviazione di Large Scale Scene Understanding, ha più di un milione di immagini etichettate in 20 categorie di oggetti e 10 scene. Alcune categorie hanno quasi 300,000 immagini, con 300 immagini specifiche per la convalida e 1000 immagini per i dati di prova.

  3. Oggetti per la casa(Collegamento)

    Il set di dati Oggetti domestici contiene immagini annotate di oggetti casuali da tutta la casa: cucina, soggiorno e bagno. Questo set di dati ha anche alcuni video annotati e 398 foto non annotate progettate per il test.

Settore automobilistico:

  1. Set di dati del paesaggio urbano (Collegamento)

    Cityscape è il set di dati a cui rivolgersi quando si cercano varie sequenze video registrate da scene di strade di diverse città. Queste immagini sono state catturate per molto tempo e in diverse condizioni meteorologiche e di luce. Le annotazioni riguardano 30 classi di immagini suddivise in otto diverse categorie.

  2. Barkley Propulsione Profonda (Collegamento)

    Barkley DeepDrive è specificamente progettato per l'addestramento di veicoli autonomi e ha più di 100mila sequenze video annotate. È uno dei dati di allenamento più utili per i veicoli autonomi in base alle mutevoli condizioni stradali e di guida.

  3. mapillary (Collegamento)

    Mapillary ha oltre 750 milioni di scene stradali e segnali stradali in tutto il mondo, il che è molto utile per addestrare modelli di percezione visiva nell'apprendimento automatico e negli algoritmi di intelligenza artificiale. Ti consente di sviluppare veicoli autonomi che soddisfano varie condizioni di illuminazione e meteorologiche e punti di vista.

Imaging medico:

  1. Set di dati di ricerca aperta sul Covid-19 (Collegamento)

    Questo set di dati originale ha circa 6500 segmentazioni polmonari poligonali pixel sulle radiografie del torace AP/PA. Inoltre, sono disponibili 517 immagini di radiografie del paziente Covid-19 con etichette contenenti il ​​nome, l'ubicazione, i dettagli del ricovero, l'esito e altro ancora.

  2. Database NIH di 100,000 radiografie del torace (Collegamento)

    Il database NIH è uno dei più estesi set di dati pubblicamente disponibili contenente 100,000 immagini radiografiche del torace e dati correlati utili per la comunità scientifica e di ricerca. Ha anche immagini di pazienti con condizioni polmonari avanzate.

  3. Atlante di patologia digitale (Collegamento)

    Atlas of Digital Pathology offre diverse immagini di patch istopatologiche, più di 17,000 in totale, da quasi 100 vetrini annotati di diversi organi. Questo set di dati è utile nello sviluppo di software di visione artificiale e riconoscimento di modelli.

Riconoscimento della scena:

Riconoscimento della scena

  1. Riconoscimento di scene in interni (Collegamento)

    Indoor Scene Recognition è un set di dati altamente classificato con quasi 15620 immagini di oggetti e scenari interni da utilizzare nell'apprendimento automatico e nell'addestramento dei dati. Viene fornito con oltre 65 categorie e ogni categoria ha un minimo di 100 immagini.

  2. xVista (Collegamento)

    Essendo uno dei più noti set di dati disponibili pubblicamente, xView contiene tonnellate di immagini aeree annotate da varie scene complesse e di grandi dimensioni. Con circa 60 classi e più di un milione di istanze di oggetti, lo scopo di questo set di dati è fornire un migliore soccorso in caso di calamità utilizzando le immagini satellitari.

  3. Partner (Collegamento)

    Places, un set di dati fornito dal MIT, ha oltre 1.8 milioni di immagini da 365 diverse categorie di scene. Ci sono circa 50 immagini in ciascuna di queste categorie per la convalida e 900 immagini per il test. È possibile apprendere le funzionalità della scena profonda per stabilire il riconoscimento della scena o le attività di riconoscimento visivo.

Intrattenimento:

  1. Set di dati WIKI IMDB (Collegamento)

    IMDB – Wiki è uno dei database pubblici più popolari di volti etichettati adeguatamente con età, sesso e nomi. Ha anche circa 20mila volti di celebrità e 62mila da Wikipedia.

  2. Volti di celebrità (Collegamento)

    Celeb Faces è un database su larga scala con 200,000 immagini annotate di celebrità. Le immagini sono dotate di rumore di fondo e variazioni di posa, il che le rende preziose per i set di test di allenamento in attività di visione artificiale. È estremamente utile per ottenere una maggiore precisione nel riconoscimento facciale, nella modifica, nella localizzazione delle parti facciali e altro ancora.

Ora che hai un enorme elenco di set di dati di immagini open source per alimentare il tuo macchinario di intelligenza artificiale. Il risultato dei tuoi modelli di intelligenza artificiale e machine learning dipende principalmente dalla qualità dei set di dati che alimenta e su cui li addestri. Se vuoi che il tuo modello di IA generi previsioni accurate, ha bisogno di set di dati di qualità che siano aggregati, etichettati ed etichettati alla perfezione. Per amplificare il successo del tuo sistema di visione artificiale, devi utilizzare database di immagini di qualità rilevanti per la visione del tuo progetto. Se stai cercando più set di dati di questo tipo Clicca qui

Share sociale

Potrebbe piacerti anche