Articoli

Azure Purview

La soluzione Azure SaaS abilitante per il data discovery, il data lineage e classificazione automatica dei dati da origini on premise, multi-cloud e SaaS

L’incremento nei volumi e dell’eterogeneità dei dati aziendali e la consapevolezza del loro valore ha aumentato l’attenzione delle aziende verso tutti quegli strumenti in grado di assicurare una data governance.

L’introduzione del GDPR ha creato la consapevolezza dell’importanza di conoscere quali dati hai, dove sono archiviati, chi ha accesso ad essi e dove vengono spostati.

Azure Purview è la soluzione SaaS per soddisfare a 360 gradi le esigenze di data governance delle aziende, in particolare consente:

  • la ricerca e la mappatura automatica delle fonti dati (data map) aziendali,
  • la classificazione dei dati con focus sull’individuazione dei dati sensibili,
  • l’analisi dei flussi di dati, “data lineage”, dalle origini alle destinazioni con le relative trasformazioni intermedie

Azure Purview ha come obiettivo il superamento delle criticità riscontrate usualmente dai consumatori, dai produttori e dai responsabili della sicurezza dei dati aziendali, in particolare:

  • individuazione delle fonti dati. L’individuazione delle fonti dati senza adeguati strumenti di catalogazione è spesso un processo ricerca complesso in quanto la conoscenza è spesso diffusa e trasversale rispetto alle funzioni aziendali. In mancanza di un catalogo centralizzato gli utenti potrebbero non essere consapevoli dell’esistenza di un’origine finché non entrano in contatto con essa.
  • indisponibilità o difficoltà di accesso alla documentazione e conseguenti difficoltà nella comprensione delle modalità d’uso previste per i dati
  • difficolta nell’individuazione degli owner dei dati. Se gli utenti hanno domande, devono trovare l’esperto o il team responsabile dei dati e interagire offline. Spesso non esiste una connessione esplicita tra dati e persone esperte del loro uso.
  • conoscenza dei processi di accesso alle fonti dati. Se gli utenti non conoscono il processo per richiedere l’accesso ad una fonte dati, l’individuazione dell’origine e della relativa documentazione non consentirà comunque di accedere ai dati.
  • creazione e manutenzione della documentazione
  • classificazione delle fonti dati
  • controllo degli accessi e documentazione dei processi di accesso ai dati
  • individuazione, analisi, protezione e governance dei dati sensibili. I dati aziendali crescono e vengono archiviati e condivisi in nuove posizioni. È necessario monitorare costantemente tutte le fonti dati per individuare contenuti sensibili, in quanto una perdita o sottrazione di dati può avere gravi ripercussioni. È fondamentale per il rispetto delle normative, assicurarsi che siano condivisi con le persone e le applicazioni giuste e con le giuste autorizzazioni.
  • verifica continua della conformità ai criteri di sicurezza aziendali.

Azure Purview include le funzionalità

  • Data map
  • Data catalog
  • Data insight

Azure_Purview

Azure Purview Data Map è il motore della soluzione su cui si innestano gli altri componenti della soluzione.

Consente, una volta configurata la connessione alla sorgente dati, l’analisi dei contenuti e la classificazione, con l’estrazione ed archiviazione dei metadati e dei riferimenti alla posizione della fonte dati. I dati non vengono copiati. I metadati vengono indicizzati per semplificare la ricerca e per rendere la fonte dati comprensibile per gli utenti finali.

Ulteriori metadati possono essere aggiunti dall’utente che ha registrato la fonte o da altri utenti abilitati. Questi metadati descrittivi integrano i metadati strutturali, come i nomi delle colonne e i tipi di dati, registrati dall’origine dati.

Attualmente sono supportate connessioni le seguenti sorgenti dati:

  • Azure Blob Storage
  • Azure Cosmos DB
  • Azure Data Explorer
  • Azure Data Lake Storage Gen1
  • Azure Data Lake Storage Gen2
  • Azure SQL DB
  • Azure SQL DB Managed Instance
  • Azure Synapse Analytics
  • Azure Dedicated SQL Pool (formerly SQL DW)
  • Hive Metastore DB
  • Oracle DB
  • SQL server on-premises
  • Teradata
  • Power BI
  • SAP ECC
  • SAP S4HANA
  • Amazon S3

Il Data Map viene mantenuto aggiornato automaticamente e può essere configurato mediante l’interfaccia utente semplice ed intuitiva Purview Studio.

È anche possibile interfacciarsi con Data Map a livello di codice usando le API open source di Apache Atlas 2.0.

DataMap

Il Data Catalog consente di effettuare ricerche per parole chiave e con filtri basati su termini di glossario, classificazioni, contatti, etichette di riservatezza e altro ancora.

Data_Catalog_Search

È possibile, inoltre, tracciare graficamente i flussi ed i processi di trasformazione dei dati.

Data_lineage

Con Data Insights, i responsabili dei dati e della sicurezza possono ottenere un quadro generale e una comprensione immediata dei dati analizzati, della posizione dei dati sensibili e di come vengono spostati.

In conclusione, Azure Purview è progettato per aiutare le funzioni aziendali a superare le criticità descritte nella governance dei dati e migliorare l’utilizzo degli asset informativi con conseguente valorizzazione e incremento dell’efficienza e redditività dell’azienda.

Microsoft Azure è una piattaforma di Cloud Computing accessibile tramite un portale online che consente di accedere e gestire i servizi e le risorse cloud forniti da Microsoft

 

Digital AI Team Leader

Azure Engineer at NEBULA