Impatto della diversità sui dati di formazione

Diversi dati di addestramento dell'IA per l'inclusività e l'eliminazione dei pregiudizi

L'Intelligenza Artificiale e i Big Data hanno il potenziale per trovare soluzioni ai problemi globali, dando priorità alle questioni locali e trasformando il mondo in molti modi profondi. L'intelligenza artificiale porta soluzioni a tutti e in tutti gli ambienti, dalle case ai luoghi di lavoro. Computer AI, con machine Learning formazione, può simulare comportamenti e conversazioni intelligenti in modo automatizzato ma personalizzato.

Tuttavia, l'intelligenza artificiale deve affrontare un problema di inclusione ed è spesso prevenuta. Fortunatamente, concentrandosi su etica dell'intelligenza artificiale può inaugurare nuove possibilità in termini di diversificazione e inclusione eliminando pregiudizi inconsci attraverso diversi dati di formazione.

Importanza della diversità nei dati di addestramento AI

Diversità dei dati di addestramento ai La diversità e la qualità dei dati di formazione sono correlate poiché l'una influenza l'altra e influisce sul risultato della soluzione AI. Il successo della soluzione AI dipende dal dati diversi è addestrato. La diversità dei dati impedisce l'overfitting dell'IA, il che significa che il modello esegue o apprende solo dai dati utilizzati per l'addestramento. Con l'overfitting, il modello AI non può fornire risultati se testato su dati non utilizzati nell'addestramento.

Lo stato attuale della formazione AI dati

La disuguaglianza o la mancanza di diversità nei dati porterebbe a soluzioni di intelligenza artificiale ingiuste, non etiche e non inclusive che potrebbero aggravare la discriminazione. Ma come e perché la diversità dei dati è correlata alle soluzioni AI?

La rappresentazione ineguale di tutte le classi porta a un'errata identificazione dei volti: un esempio importante è Google Foto che ha classificato una coppia nera come "gorilla". E Meta chiede a un utente che guarda un video di uomini di colore se l'utente desidera "continuare a guardare video di primati".

Ad esempio, una classificazione imprecisa o impropria delle minoranze etniche o razziali, in particolare nei chatbot, potrebbe provocare pregiudizi nei sistemi di formazione dell'IA. Secondo il rapporto del 2019 su Sistemi discriminanti: genere, razza, potere nell'IA, oltre l'80% degli insegnanti di IA sono uomini; le ricercatrici di intelligenza artificiale su FB costituiscono solo il 15% e il 10% su Google.

L'impatto di diversi dati di formazione sulle prestazioni dell'IA

Impatto della diversità sui dati di addestramento L'esclusione di gruppi e comunità specifici dalla rappresentazione dei dati può portare a algoritmi distorti.

La distorsione dei dati viene spesso introdotta accidentalmente nei sistemi di dati, sottocampionando determinate razze o gruppi. Quando i sistemi di riconoscimento facciale vengono addestrati su volti diversi, aiutano il modello a identificare caratteristiche specifiche, come la posizione degli organi facciali e le variazioni di colore.

Un altro risultato di avere una frequenza sbilanciata di etichette è che il sistema potrebbe considerare una minoranza come un'anomalia quando pressurizzato per produrre un output in breve tempo.

Parliamo oggi dei requisiti relativi ai dati di addestramento AI.

Raggiungere la diversità nei dati di formazione AI

D'altra parte, anche la generazione di un set di dati diversificato è una sfida. L'assoluta mancanza di dati su alcune classi potrebbe portare a una sottorappresentazione. Può essere mitigato rendendo i team di sviluppatori di intelligenza artificiale più diversificati rispetto a competenze, etnia, razza, genere, disciplina e altro. Inoltre, il modo ideale per affrontare i problemi di diversità dei dati nell'IA è affrontarli dall'inizio invece di cercare di correggere ciò che è stato fatto, infondendo diversità nella fase di raccolta e cura dei dati.

Indipendentemente dal clamore intorno all'IA, dipende ancora dai dati raccolti, selezionati e addestrati dagli esseri umani. Il pregiudizio innato negli esseri umani si rifletterà nei dati raccolti da loro, e questo pregiudizio inconscio si insinua anche nei modelli ML. 

Passaggi per la raccolta e la cura di diversi dati di formazione

Inclusione della diversità dei dati formativi

Diversità dei dati può essere raggiunto da:

  • Aggiungi con attenzione più dati da classi sottorappresentate ed esponi i tuoi modelli a vari punti dati. 
  • Raccogliendo dati da diverse fonti di dati. 
  • Aumentando i dati o manipolando artificialmente set di dati per aumentare/includere nuovi punti dati nettamente diversi dai punti dati originali. 
  • Quando assumi candidati per il processo di sviluppo dell'IA, rimuovi dall'applicazione tutte le informazioni irrilevanti per il lavoro. 
  • Migliorare la trasparenza e la responsabilità migliorando la documentazione dello sviluppo e della valutazione dei modelli. 
  • Introdurre norme per costruire la diversità e inclusività nell'IA sistemi dal livello di base. Vari governi hanno sviluppato linee guida per garantire la diversità e mitigare i pregiudizi dell'IA che possono fornire risultati iniqui. 

[Leggi anche: Ulteriori informazioni sul processo di raccolta dei dati di addestramento AI ]

Conclusione

Attualmente, solo poche grandi aziende tecnologiche e centri di apprendimento sono coinvolti esclusivamente nello sviluppo di soluzioni AI. Questi spazi d'élite sono intrisi di esclusione, discriminazione e pregiudizi. Tuttavia, questi sono gli spazi in cui si sta sviluppando l'intelligenza artificiale e la logica alla base di questi sistemi avanzati di intelligenza artificiale è piena dello stesso pregiudizio, discriminazione ed esclusione sopportati dai gruppi sottorappresentati. 

Mentre si discute di diversità e non discriminazione, è importante mettere in discussione le persone che ne beneficiano e quelle che danneggiano. Dovremmo anche guardare a chi mette in svantaggio: forzando l'idea di una persona "normale", l'IA potrebbe potenzialmente mettere a rischio "altri". 

Discutere la diversità nei dati dell'IA senza riconoscere le relazioni di potere, l'equità e la giustizia non mostrerà il quadro più ampio. Per comprendere appieno la portata della diversità nei dati di addestramento dell'IA e come gli esseri umani e l'IA possono insieme mitigare questa crisi, contatta gli ingegneri di Shaip. Disponiamo di diversi ingegneri IA in grado di fornire dati dinamici e diversificati per le tue soluzioni IA. 

Share sociale