Conversazioni sanitarie sintetiche per l'ASR

Abilitazione dello sviluppo della tecnologia ambientale attraverso conversazioni sanitarie sintetiche

Tecnologia ambientale

Oltre 2000 ore di dati audio raccolti e trascritti in ambito clinico

Nel settore in rapida evoluzione dell’intelligenza artificiale conversazionale, una delle applicazioni più importanti è nel settore sanitario, dove la tecnologia viene utilizzata per semplificare le interazioni fornitore-paziente. Il nostro cliente, un nome leader nella tecnologia sanitaria, si è rivolto a Shaip con la necessità di migliorare il proprio modello di riconoscimento vocale automatico (ASR) per comprendere e trascrivere meglio le conversazioni con più parlanti in ambienti clinici. A causa delle normative sulla privacy, acquisire dialoghi nel mondo reale è stato impegnativo; quindi, l’idea era quella di creare e trascrivere interazioni sintetiche ma realistiche tra operatori sanitari e pazienti.

Volume

2,000 ore, o circa 12,000 a 24,000 interazioni sintetiche individuali di 10 durata media dei minuti.

Obiettivo

Il nostro obiettivo principale era generare circa 2,000 ore di registrazioni audio, traducendosi in 12,000-24,000 interazioni sintetiche meticolosamente realizzate, incarnando una diversità di genere, età, accenti e ruoli medici. Questo set di dati completo e autentico, progettato per imitare i dialoghi clinici del mondo reale, è stato creato rispettando rigorosamente le normative sulla privacy come HIPAA. Le interazioni sintetiche sono servite come un ricco set di dati, determinante nella formazione e nel perfezionamento del modello ASR del nostro cliente, migliorando significativamente la sua competenza nella gestione delle conversazioni del mondo reale all'interno di contesti clinici.

 

Obiettivi

Le sfide

Conformità normativa

Garantire il rispetto delle leggi sulla privacy come l’HIPAA creando allo stesso tempo interazioni sanitarie realistiche ma sintetiche può essere difficile.

Conformità normativa

Autenticità e diversità dei dati

Creare interazioni sintetiche che imitino accuratamente i dialoghi clinici del mondo reale, abbracciando al tempo stesso un'ampia gamma di scenari, accenti, età e ruoli medici, richiede un approccio meticoloso e una profonda conoscenza del settore.

Autenticità e diversità dei dati

Certificazione di qualità

Il raggiungimento di un elevato livello di accuratezza nella trascrizione, come il tasso di accuratezza delle parole (WER) del 95% e il tasso di accuratezza dei tag (TER) del 90%, richiede rigorosi processi di garanzia della qualità.

Capacità tecniche

Garantire che l’infrastruttura tecnica, comprese le piattaforme di registrazione e trascrizione, possa gestire il volume di dati e mantenerne la qualità è una sfida significativa.

Reclutamento e formazione delle risorse

Reclutare persone con background medico per il gioco di ruolo e assicurarsi che aderiscano a scenari realistici mantenendo un flusso di conversazione naturale può essere piuttosto impegnativo. Inoltre, la formazione dei trascrittori affinché rispettino rigorose linee guida sulla qualità richiede notevoli sforzi e competenze.

Approccio/Soluzione

Raccolta e trascrizione audio

  • Creazione dello scenario: Scenari realistici sviluppati che rispecchiano condizioni comuni non urgenti incontrate nelle pratiche di medicina familiare degli adulti, come l'ipertensione, il diabete e la gestione del dolore.
  • Gioco di ruolo: Persone reclutate con background medico per interpretare il ruolo di operatori sanitari e pazienti, aderendo agli scenari forniti e simulando conversazioni cliniche nel mondo reale.
  • Registrazione: Utilizzo dell'app mobile Shaip Work per acquisire l'audio, garantendo una rappresentazione diversificata in termini di genere, età, accenti e background professionale tra i partecipanti.

Validazione e trascrizione

  • Script di convalida eseguiti per garantire l'accuratezza e la qualità dei file audio.
  • Le trascrizioni sono state effettuate sulla piattaforma Bhasha, attenendosi alle specifiche linee guida fornite, e garantendo la trascrizione letterale del testo con precisa diarizzazione.
  • Metadati annotati tra cui ID del relatore, età, sesso, lingua madre e formazione/esperienza medica, che erano fondamentali per gli scopi di formazione del modello del cliente.

Certificazione di qualità

  • Controlli di qualità completi da parte di CQA e PMO hanno garantito un obiettivo di qualità di trascrizione del 95% di tasso di accuratezza delle parole (WER) e del 90% di tasso di accuratezza dei tag (TER).

Consegna dei dati

  • Ho strutturato i dati in modo chiaro e organizzato e li ho consegnati in batch, insieme a note dettagliate sui batch e directory delle culture.
  • Garantito che tutti i dati, inclusi file audio, trascrizioni e metadati, fossero accuratamente etichettati e formattati secondo le specifiche del cliente.

Feedback e iterazione

Stabilito un solido ciclo di feedback con il cliente per identificare eventuali carenze, garantendo che venissero apportate correzioni e che fosse fornito un set di dati completo e accurato.

Successi principali

  • Raccolta e trascrizione riuscita di 2000 ore di interazioni sanitarie sintetiche.
  • Trascrizione rapida e accurata con un notevole tasso di precisione, che contribuisce in modo significativo all'obiettivo del cliente di migliorare il proprio modello ASR.
  • Dimostrata la capacità di Shaip di gestire progetti complessi su larga scala con un approccio meticoloso verso la qualità e l'accuratezza.

Risultato

Il progetto meticolosamente eseguito e facilitato da Shaip ha prodotto un ricco set di dati che ha contribuito in modo significativo al miglioramento del modello ASR del cliente. Le interazioni sintetiche hanno creato una rappresentazione realistica dei dialoghi clinici, aiutando il cliente a ottenere un servizio vocale più robusto e affidabile per gli ambienti sanitari. Attraverso un approccio strutturato e ben coordinato, Shaip ha assicurato la consegna di successo di un progetto complesso entro i tempi stabiliti, consolidando la propria esperienza nella gestione di progetti di intelligenza artificiale conversazionale su larga scala nel settore sanitario.

La nostra collaborazione con Shaip ha fatto avanzare in modo significativo il nostro progetto di tecnologia ambientale e intelligenza artificiale conversazionale nel settore sanitario. La loro esperienza nella creazione e trascrizione di dialoghi sanitari sintetici ha fornito una solida base, dimostrando il potenziale dei dati sintetici nel superare le sfide normative. Con Shaip abbiamo superato questi ostacoli e ora siamo un passo avanti verso la realizzazione della nostra visione di soluzioni sanitarie intuitive.

Golden-5 stelle

Accelera la tua IA sanitaria
sviluppo di applicazioni del 100%