Può essere vantaggioso in ambito medico sanitario? Parte 1.

Il termine DeepSeek nasce dalla fusione dei concetti di “Deep” (profondo) e “Seek” (cercare), elementi che evidenziano la natura esplorativa e analitica di questa intelligenza artificiale. L’obiettivo principale di DeepSeek è quello di fornire risposte approfondite, superando i limiti di modelli generalisti per focalizzarsi su un approccio rigoroso e mirato alla risoluzione di problemi. Questo tipo di IA è stato concepito per rispondere a esigenze specifiche del panorama tecnologico attuale, con particolare attenzione all’ottimizzazione di codice, gestione di dati complessi e analisi scientifiche. Inoltre, la capacità di bilanciare velocità ed efficacia la rende uno strumento fondamentale per gli utenti che necessitano di soluzioni precise e veloci.

Come nasce questo articolo

Sin dall’inizio sfrutto modelli AI basati LLM per eseguire ricerche, estrapolare velocemente informazioni da articoli, porre domande specifiche su patologie o riassumere stati dell’arte medica. Ho svolto on line corsi di “Prompt Engineering” al fine ottimizzare al meglio le “richieste” ai moderni chatbot (i Prompt, sono in pratica le richieste, le istruzioni, che voi inserite nella chat AI). Di recente lavoro molto con Chat-GPT o4 a pagamento, grazie al quale ho scritto questo stesso articolo e riassunto i contenuti delle chat che ho sostenuto con DeepSeek: ho praticamente intervistato il Chat-Bot, poi ho fornito le chat a Chat-GPT per organizzarne i contenuti. Sempre aperto e curioso ad ogni novità, ho voluto subito capire potenzialità e limitazioni di questo strumento in ambito medico sanitario.

Le Capacità di DeepSeek

DeepSeek si distingue per un ventaglio di funzionalità:

  • Risoluzione di problemi complessi: Eccelle nell’analisi multi-step, facilitando la gestione di richieste articolate che richiedono scomposizione logica e valutazione.
  • Elaborazione e analisi di dati: Estrae insight rilevanti da grandi set di dati, consentendo agli utenti di ottenere risposte chiare e utili in tempi ridotti.
  • Generazione e ottimizzazione di codice: Supporta linguaggi di programmazione come Python, JavaScript, SQL e molti altri, fornendo soluzioni ottimizzate e personalizzate per gli sviluppatori.
  • Traduzioni e supporto multilingue: Garantisce traduzioni precise con un’attenzione particolare alla contestualizzazione culturale, specialmente per il cinese e l’inglese.
  • Analisi di documenti: Identifica i punti chiave di articoli e report, agevolando l’accesso rapido alle informazioni più rilevanti.
  • Supporto tecnico: Risponde a dubbi su software, dispositivi e tecnologie, offrendo un supporto pratico e immediato.
 

Anche DeepSeek permette di analizzare in maniera efficace file PDF, anche complessi come l’ estrazione del testo, riassunto e sintesi di punti chiave. Pare non ci siamo limiti su grandi file, ma suggerisce di lavorare con documenti di dimensioni ragionevoli per garantire efficienza e velocità. In generale, se dovete lavorare velocemente con documenti PDF, meglio partire da NotebookLM, a mio avviso insostituibile.

Come Chat-GPT è in grado di generare tabelle, linee di codice, esportare questi in formato pdf, Word ed Excel.

La funzione "DeepThink"

Questa funzione è sicuramente l’elemento distintivo di DeepSeek, pensato per fornire risposte strutturate e dettagliate. Ideale per chi necessita di approfondimenti accurati, questo strumento è stato progettato per affrontare quesiti complessi in modo sistematico, rendendolo unico tramite una caratteristica che in seguito vedremo. In pratica scriviamo il prompt, attiviamo la funzione ,ed ecco che la modalità DeepThink:

  1. Divide la richiesta in sotto-domande per identificarne le componenti fondamentali.
  2. Accede a un database esteso per reperire informazioni rilevanti e dettagliate.
  3. Organizza le risposte in modo logico e coerente, garantendo una struttura chiara.
  4. Traduce il contenuto nella lingua richiesta, rispettando le sfumature linguistiche
    e culturali.
  1. Da utilizzare quando:
    • Si necessita di analisi approfondite, come valutazioni di opzioni o decisioni strategiche.
    • Si lavora con documenti lunghi o complessi che richiedono sintesi e organizzazione.
    • Serve una risposta strutturata e precisa per progetti accademici o professionali.
  1. Non utilizzare se:
    • La richiesta richiede una risposta breve e immediata.
    • La priorità è la rapidità piuttosto che la profondità dell’analisi.

Prima della risposta salterà ai nostri occhi un testo in grigio chiaro, ed è uno degli aspetti caratteristici di DeepThink . Questo elemento rappresenta una sorta di processo trasparente di ragionamento, mostrando come il suo “cervello” elabora i dati. In pratica offre:

  • Chiarezza metodologica: Permette di comprendere come l’IA struttura la risposta.
  • Strumento didattico: Utile per studenti e professionisti, consente di apprendere strategie di analisi e problem-solving avanzate
  • Debug: se la risposta non si avvicina alle vostre esigenze, è qui che potrete vedere dove non funziona il suo “stream of consciousness” e di conseguenza intervenire con un prompt più mirato o corretto..

Database e addestramento di DeepSeek

L’addestramto di DeepSeek si basa su un ampio spettro di fonti, con un cut-off del database a Luglio 2023:

  • Dati generici: Include libri, articoli accademici, pagine web e contenuti open-source, fornendo una base di conoscenze ampia e diversificata.
  • Dati specializzati: Database come PubMed e repository di codice (es. GitHub) per garantire competenze specifiche in ambiti tecnici e scientifici.
  • Dati conversazionali: Dialoghi simulati e interazioni online per migliorare le capacità di comunicazione e interazione.
  • Filtri di qualità: Applicazione di processi di deduplicazione e rimozione di contenuti inappropriati, assicurando risposte affidabili e eticamente corrette

Stando a DeepSeek stesso il suo addestramento Medico è basato su:

  • Fonti internazionali: Pubblicazioni come The Lancet, NEJM e linee guida dell’OMS, per garantire accuratezza e rilevanza scientifica.
  • Fonti asiatiche: Documenti sulla medicina tradizionale cinese (MTC) e riviste locali, offrendo un approccio bilanciato tra medicina moderna e tradizionale. Proverò in futuro a vedere quanto veramente bilanciato.
  • Prospettiva globale: L’integrazione di fonti occidentali e asiatiche consente di ottenere una visione olistica, particolarmente utile per contesti multiculturali

L'imprinting asiatico

Essendo stato sviluppato da un team cinese, sotto anche una sorta silenzioso supporto del Governo, DeepSeek riflette chiaramente un’impronta culturale asiatica.

  • Ottimizzazione linguistica: Eccelle nella gestione della lingua cinese, rispondendo con precisione a quesiti legati a cultura, tradizioni e normative locali. Eccellente per traduzioni Cinese-Inglese e viceversa.
  • Focalizzazione regionale: Particolarmente adatto per chi opera in contesti asiatici, grazie a un database mirato su regolamentazioni e pratiche regionali
  • Censura: parlare di storia moderna cinese o politica cinese con questo modello, darà risultati in linea con il Governo di Pechino.

Differenze cardine tra Chat-GPT e DeepSeek

  • Specializzazione vs generalismo: DeepSeek è orientato a task tecnici e analitici, mentre GPT eccelle nella creatività e nella generazione di contenuti ampi e fluidi.
  • Ottimizzazione culturale: DeepSeek è più focalizzato sul contesto asiatico, mentre GPT offre una visione più globale e diversificata.
  • Efficienza tecnica: DeepSeek è progettato per garantire risultati rapidi e mirati in ambiti specifici, differenziandosi dalla versatilità generalista di GPT.

Qui forse uno dei motivi chiave per cui DeepSeek è più efficiente di GPT: non si perde in chiacchere. Non si sofferma a curare stile linguistico, un eventuale pubblico, scopo del testo… fornisce innanzitutto risposte. Ma se volete, a detta sua, una Poesia ve la scrive pure.

Caratteristiche

DeepSeek

GPT

Utilizzo principale

Analisi di dati, sviluppo software, task tecnici e strutturati

Generazione di contenuti creativi, conversazioni aperte

Punti di forza

Precisione tecnica, logica strutturata

Flessibilità tematica, fluidità narrativa

Contesto ottimale

Progetti accademici e professionali, dove è richiesta accuratezza

Progetti creativi o brainstorming, dove l’immaginazione è fondamentale

Ottimizzazione culturale

Maggiore enfasi sul contesto asiatico e cinese

Approccio più generalista con una visione globale

Velocità vs Creatività

Favorisce rapidità e precisione nel problem-solving

Privilegia l’esplorazione e la creatività narrativa

Esempi di utilizzo

Generazione di codice, analisi strutturata di documenti

Scrittura di racconti, dialoghi, testi di marketing

Conclusioni Preliminari

In campo medico sanitario la capacità di sintesi di questo strumento potrebbe dare grossi benefici, a confronto della ripetitività ed eccessiva cautela da parte di Chat-GPT nell’affrontare argomenti medici. La memoria a breve termine limitata di DeepSeek, contestualizzazione asiatica di database e modelli culturali/linguistici, potrebbero influenzare ricerche o analisi di contenuti. Allo stesso tempo la sua velocità di risposta e un database aggiornato a luglio 2024, potrebbero in certi ambiti essere dei punti di forza. Cosa da non poco, al momento DeepSeek è GRATUITO. A breve proverò a testare, a parità di prompt, le risposte dei due modelli a contesti di ricerca articoli, comprensione di studi, riassunti su patologie, anamnesi. I risultati saranno pubblicati in un altro articolo non appena il sito di DeepSeek sarà di nuovo utilizzabile, libero da traffico ed attacchi. Al momento la caratteristica che più mi ha lasciato più soddisfatto è la possibilità di visionare il suo “flusso di coscienza” attivando il DeepThink, davvero illuminante se vogliamo capire le risposte ottenute e scrivere prompt più performanti.

DeepSeek in numeri

 

Aspetto

Dettaglio

Data di nascita

Rilasciato nel 2023 (Cina), aggiornamenti database fino al 2024.

Parametri del modello

10-100+ miliardi di parametri (a seconda della versione).

Finestra di contesto

Fino a 32k token (estendibili a 128k in versioni sperimentali).

Dati di addestramento

8+ trilioni di token, 200+ lingue, focus su cinese/inglese.

Database conoscenza

Centinaia di terabyte, aggiornato a luglio 2023.

Velocità di risposta

20-30 token/secondo, risposte in <2 secondi.

Memoria a breve termine

Mantiene il contesto per ~30 minuti o 10-15 interazioni.

Lingue supportate

Eccelle in cinese e inglese; 50+ lingue con capacità minori.

Accuratezza (MMLU)

Oltre l’85% in comprensione del testo.

Consumo energetico

~0.001-0.003 kWh/query (come 10-30 secondi di una lampadina LED).

Hardware di addestramento

Cluster con migliaia di GPU NVIDIA A100/H100.

Dimensioni del modello

~20 GB per una versione da 10B parametri (float16/int8). Centinaia di terabyte per il modello esteso da 100+MLRD di parametri.

Note

Nessuna memoria persistente: ogni conversazione è isolata per garantire privacy.

Errori comuni

Imprecisioni in calcoli complessi o eventi post-luglio 2024.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *