Miglioramento della ricerca sulla PNL oncologica

Precisione dei dati oncologici: licenza, deidentificazione e annotazione per l'innovazione del modello NLP

PNL oncologico

Rivoluzionare la cura del cancro con tecnologie PNL all'avanguardia

Il cliente, uno dei principali attori del settore sanitario, richiedeva una soluzione NLP avanzata per elaborare un volume considerevole di cartelle cliniche oncologiche. Nell’ambito di un’iniziativa fondamentale per perfezionare la ricerca oncologica, la necessità di bilanciare l’analisi dettagliata dei dati con rigorosi standard di privacy è fondamentale. Questo caso di studio delinea il nostro contributo al miglioramento delle attività di ricerca del cliente attraverso l'annotazione dei dati ad alta fedeltà, pratiche rigorose di deidentificazione e l'applicazione di tecniche di elaborazione del linguaggio naturale (NLP), il tutto all'interno del quadro normativo fornito da HIPAA.

Volume

Licenza dati + Deid dati
10 Pagine
Relazioni oncologiche
10 Pagine
Dominio non oncologico
10 Pagine
Negazione
10 Pagine
Dominio oncologico
10 Pagine
NER + Mappatura delle relazioni
10 Pagine

Le sfide

Il progetto richiedeva una comprensione approfondita della documentazione clinica, un'identificazione precisa delle entità mediche e la capacità di applicare accuratamente le etichette di negazione, il tutto all'interno di un quadro sicuro che protegge la privacy del paziente secondo le normative HIPAA. L'impresa ha richiesto non solo competenze tecniche nella gestione di grandi volumi di dati complessi, ma anche un approccio strategico per incorporare feedback e mantenere la qualità in tutte le fasi del processo di annotazione.

Obiettivi

Descrizione dettagliata dei servizi

CategoriaDescrizione
Copertura completa dei dati cliniciCoprendo vari tipi di note, contesti assistenziali e sottospecialità oncologiche, garantendo un solido set di dati che riflette diversi scenari clinici.
Rigorosa deidentificazioneGarantire che tutti i record etichettati siano deidentificati in conformità con il metodo Safe Harbor di HIPAA, garantendo la fiducia del cliente nella privacy e nella sicurezza dei dati.
Linee guida per l'annotazioneCreazione e implementazione di linee guida standard per l'annotazione dei dati per la preparazione di record etichettati in linea con gli standard HIPAA.
Strategie di annotazione avanzateÈ stata effettuata l'annotazione manuale di 10,000 pagine di documenti correlati all'oncologia con un'attenzione particolare all'identificazione degli stati di negazione e di altre informazioni pertinenti in conformità con le linee guida stabilite.
Rigorosa garanzia di qualitàRaggiungere lo standard di qualità specificato delineato nella linea guida

Soluzione

Il nostro approccio prevedeva le seguenti strategie chiave:

Compilazione di set di dati oncologici personalizzati

Da un vasto archivio di oltre 5 MN EHR, è stato estratto un sottoinsieme di dati accuratamente scelto, con l'obiettivo di soddisfare le esigenze specializzate del cliente per i dati oncologici con particolare attenzione alle entità genomiche. Il processo di raccolta ha comportato la creazione di un elenco esaustivo di marcatori tumorali, geni, varianti e stadi TNM, utilizzando ricerche per parole chiave per individuare i documenti abbondanti in questi dati. Le espressioni regolari sono state utilizzate per identificare una serie di variazioni genetiche e stadi del cancro. Questo approccio, combinato con un’ampia copertura di dati che comprende vari tipi di documenti, specialità, contesti assistenziali e dati di più medici, ha garantito un set di dati oncologici completo e pertinente.

Compilazione di set di dati oncologici

Rigorosa deidentificazione

Il processo ha aderito rigorosamente al metodo Safe Harbor di HIPAA per la deidentificazione, che garantisce la fiducia del cliente nella privacy e nella sicurezza dei dati. Ciò comporta la rimozione di tutte le informazioni sanitarie protette (PHI) e la loro sostituzione con segnaposto etichettati, mantenendo così l'utilità dei dati e proteggendo al tempo stesso la riservatezza del paziente.

Variabili di deidentificazione

Categoriasottocategoria
NomeNome del paziente, Nome del medico, Nome dell'infermiere, Nome del familiare, Nome del centro medico, Nome della clinica, Nome della casa di cura, Nome dell'azienda, Nome dell'Università
Età 
DataSchema data, Schema mese-anno, Schema giorno-mese, Schema giorno-anno, Giorno, Mese, Anno, Stagione
DovePaese, Stato, Città, Via, Codice postale, Numero di camera, Numero di suite, Numero di piano
IDNumero di previdenza sociale, Numero di cartella clinica, Numero del beneficiario del piano sanitario, Numero di conto, Numero di certificato/licenza, ID biometrico, ID di registrazione, Numero di adesione, Numero di identificazione del veicolo, Numero di targa Identificatori del dispositivo e numero di serie
ContattiNumero di telefono, Numero di fax, Indirizzo e-mail, URL Web, Indirizzo IP

Esempio:

Il 25 settembre 2106, alle 11:00, il signor Harry Pace, 90 anni, è stato ricoverato al Forrest General Hospital per un intervento chirurgico programmato all'anca, precedentemente consultato dal suo medico di base, il dottor Jose Martin, e assistito da Kendra Reith, MD. Durante la sua permanenza, è stato affidato alle cure di Mary Hu, NP, e Suzan Ray, RN, con la consultazione anche di R. Charles Melancon, PA. L'operazione, effettuata lo stesso giorno del ricovero, ha avuto successo senza che siano state segnalate complicazioni. Dopo l'intervento chirurgico, il signor Pace è stato trasferito nella stanza 202, piano 2, per il recupero. Sua moglie, Emma Pace, era presente durante tutto l'evento e le sono stati forniti tutti gli aggiornamenti necessari. Durante il suo breve soggiorno, le sue cartelle cliniche, inclusi MRN MR99062619 e Account KV000014764, sono state gestite secondo i protocolli standard della Gracewood Nursing Home, la sua precedente residenza. È stato dimesso più tardi lo stesso giorno presso la clinica ambulatoriale di Oakland per un ulteriore recupero. Durante tutto il processo, tutte le procedure sono state documentate e protette nel rispetto degli standard di riservatezza.

Esempio: deidentificato

On [Modello data], alle ore 11:00, il sig. [Nome paziente], anni [Età], è stato ammesso [Nome del centro medico] per un intervento chirurgico programmato all'anca, precedentemente consultato dal suo medico di base Dott. [Nome del medico], e frequentato da [Nome del medico] MD. Durante la sua permanenza è stato affidato alle cure di [Infermiere tirocinante], NP, e [Infermiere tirocinante], Marina militare, con [Nome del medico], PA, anch'essa consultata. L'operazione, effettuata lo stesso giorno del ricovero, ha avuto successo senza che siano state segnalate complicazioni. Dopo l'intervento chirurgico, il Sig. [Nome paziente] è stato trasferito nella stanza n. [Numero di Camera], Piano n. [Numero del piano], per il recupero. Sua moglie, [Nome del familiare], era presente durante tutto il soggiorno e le sono stati forniti tutti gli aggiornamenti necessari. Durante il suo breve soggiorno, le sue cartelle cliniche, compreso l'MRN [Numero della cartella clinica] e Conto [Numero di conto], sono stati gestiti secondo i protocolli standard di [Nome della casa di cura], la sua precedente residenza. È stato dimesso più tardi lo stesso giorno alle cure di [Nome della clinica] per un ulteriore recupero. Durante tutto il processo, tutte le procedure sono state documentate e protette nel rispetto degli standard di riservatezza.

Linee guida per l'annotazione e tecniche di annotazione avanzate

Shaip è stato determinante nella definizione e implementazione delle linee guida standard per l'annotazione dei dati, garantendo che tutti i record etichettati fossero preparati in modo coerente e conforme agli standard HIPAA. Inoltre, sono state meticolosamente annotate 10,000 pagine di varie cartelle cliniche, con particolare attenzione all'etichettatura dettagliata degli stati di negazione e di altre entità clinicamente rilevanti, comprese varie sottospecialità oncologiche. Le annotazioni sono state effettuate da un team di annotatori esperti con conoscenze specializzate in oncologia e normative sulla privacy dei dati.

Criteri di annotazione complessi

Categoriasottocategoria
Annotazione della data (oncologia)Data di diagnosi, Data di fase, Insorgenza, Data di procedura, Data di inizio della terapia, Data di fine della terapia, Data di inizio della radiazione, Data di fine della radiazione
Malattia (oncologia)Problema del cancro, Istologia, Stato clinico, Sede corporea, Comportamento, Grado, Stadio del cancro, Stadio TNM, Test dei marcatori tumorali, Dimensioni, Codice
Trattamento (oncologia)Medicina del cancro, dosaggio del farmaco, frequenza, chirurgia del cancro, risultato dell'intervento, modalità di radiazione, dosaggio delle radiazioni
GenomicaCodice di variazione, gene studiato, metodo, campione
NegazioneNegativo, Possibile Negativo, Incerto, Possibile Positivo
NER clinicoProblema del cancro – Sede corporea, Istologia – Sede corporea, Comportamento – Sede corporea, Chirurgia del cancro – Relazioni Sede corporea, Modalità di radiazione – Sede corporea, Istologia – Grado, Problema cancro – Dimensione

Esempio:

Dichiarazione della nota clinica oncologica

Dichiarazione di nota clinica oncologica

“Alla paziente Jane Doe è stato diagnosticato un cancro polmonare non a piccole cellule (NSCLC) allo stadio IIIB, in particolare un adenocarcinoma, il 03/05/2023. Il cancro si trova nel lobo inferiore destro del polmone. È classificato come T3N2M0 secondo il sistema di stadiazione TNM, con una dimensione del tumore di 5 cm x 3 cm. Una delezione dell'esone 19 dell'EGFR è stata identificata attraverso l'analisi PCR del campione bioptico del tumore. La chemioterapia con Carboplatino AUC 5 e Pemeterxed 500 mg/m² è stata iniziata il 03/20/2023 e deve essere somministrata ogni 3 settimane. Il 60/30/04 è iniziata la radioterapia a fasci esterni (EBRT) alla dose di 01 Gy in 2023 frazioni. Il trattamento del paziente è in corso e non ci sono prove di metastasi cerebrali dalla recente risonanza magnetica. La possibilità di invasione linfovascolare deve ancora essere determinata e la tolleranza del paziente all'intero regime chemioterapico rimane incerta.

Dichiarazione di nota clinica oncologica

Dichiarazione della nota clinica oncologica

Rigorosa garanzia di qualità

Implementato un quadro flessibile di gestione dei progetti che ha facilitato l'efficace integrazione del feedback dei clienti rispettando rigorosi standard di qualità. È stato applicato un protocollo completo di garanzia della qualità, in linea con le linee guida per raggiungere i parametri di riferimento di qualità richiesti. Questo protocollo prevedeva cicli successivi di revisione e verifica, garantendo la precisione e l'affidabilità dei dati annotati. Un controllo così meticoloso della qualità è fondamentale per creare una soluzione PNL affidabile, vitale per un processo decisionale clinico informato e per l’eccellenza della ricerca.

Risultato

Consegnati con successo 10,000 record etichettati anonimizzati e di alta qualità, fornendo un set di dati sicuro e prezioso per lo sviluppo del modello NLP del cliente. L'applicazione meticolosa della PNL e l'adesione agli standard di deidentificazione HIPAA hanno prodotto un set di dati altamente raffinato che sosterrà gli sforzi di ricerca oncologica attuali e futuri del cliente, con l'obiettivo finale di migliorare i risultati dei pazienti oncologici e l'efficienza nell'erogazione delle cure.

Il successo del progetto dimostra la nostra capacità di gestire dati medici complessi con precisione, contribuendo all'obiettivo del cliente di migliorare i risultati della cura dei pazienti e accelerare il ritmo dell'innovazione sanitaria.

La nostra partnership con Shaip è stata determinante nel far avanzare le nostre capacità di PNL nel settore oncologico. La gestione professionale di 10,000 cartelle cliniche, annotate con negazioni dettagliate e altre entità cliniche, ha dimostrato il loro impegno verso l'eccellenza e la conformità. Inoltre, il loro impegno nei confronti degli standard sulla privacy come HIPAA ci ha fornito risorse inestimabili per portare avanti le nostre iniziative di intelligenza artificiale per lo sviluppo di trattamenti oncologici e diagnostici all’avanguardia.

Golden-5 stelle

Accelera la tua IA sanitaria
sviluppo di applicazioni del 100%