Cos'è Unity Catalog?

Unity Catalog è il livello di governance unificato integrato in Azure Databricks. Quando è abilitata per un'area di lavoro, Unity Catalog opera sotto ogni interazione dei dati nelle aree di lavoro automaticamente: l'applicazione del controllo di accesso quando si esegue una query su una tabella, il rilevamento della derivazione quando si spostano i dati, l'attività di registrazione per il controllo e altro ancora. Gli oggetti di Unity Catalog vengono amministrati tramite Catalog Explorer, SQL, l'interfaccia della riga di comando di Azure Databricks e le API REST.

Il catalogo Unity viene abilitato automaticamente per tutte le aree di lavoro Azure Databricks create dopo il 9 novembre 2023.

Unity Catalog è anche disponibile come implementazione open-source. Consulta il blog dell'annuncio e il pubblico repository GitHub del catalogo di Unity.

Modello a oggetti del Catalogo Unity

Ogni asset gestito in Unity Catalog viene modellato come oggetto a protezione diretta, un oggetto in cui è possibile concedere autorizzazioni a utenti, entità servizio o gruppi. Gli asset di dati, ad esempio tabelle, viste, volumi, funzioni e modelli seguono uno spazio dei nomi a tre livelli (catalog.schema.object). Le tabelle e i volumi possono essere gestiti, in cui Il catalogo unity gestisce sia la governance che il ciclo di vita di archiviazione dei file sottostanti, o esterno, in cui Il catalogo unity gestisce solo la governance. Altri oggetti, ad esempio credenziali di archiviazione, posizioni esterne, connessioni e condivisioni, si trovano direttamente nel metastore.

Diagramma del modello a oggetti del catalogo Unity

Le pagine seguenti illustrano in modo più dettagliato i concetti e i flussi di lavoro del catalogo Unity di base.

Topic Descrizione
Oggetti proteggibili Informazioni su ogni tipo di oggetto nella gerarchia del catalogo Unity e su come si applicano le autorizzazioni.
Asset gestiti e esterni Comprendere la differenza tra tabelle e volumi gestiti ed esterni e quando usarli.
Requisiti e limitazioni Esaminare i requisiti di calcolo, i formati di file supportati, i vincoli di denominazione e le limitazioni note.

Funzionalità del catalogo Unity

Unity Catalog offre strumenti predefiniti per la governance di ogni dimensione dei dati e dell'ambiente di intelligenza artificiale. Gli argomenti seguenti illustrano le principali aree di funzionalità.

Topic Descrizione
Controllo di accesso Gestisci chi può accedere a cosa tramite privilegi, criteri basati sugli attributi, filtri di riga e di colonna e associazioni dell'area di lavoro.
Individuazione dei dati Interagisci con gli oggetti proteggibili usando Catalog Explorer, l'interfaccia utente di Azure Databricks per individuare e gestire le risorse di dati e IA registrate in Unity Catalog.
Tracciabilità dei dati Tenere traccia automaticamente del modo in cui i flussi di dati e le trasformazioni vengono trasformati dall'origine alle visualizzazioni finali e ai dashboard.
Revisione contabile Mantenere un record completo di tutte le attività di accesso ai dati e di sistema usando la tabella di sistema del log di controllo.
Classificazione dei dati Classificare e contrassegnare automaticamente i dati sensibili nel catalogo.
Monitoraggio della qualità dei dati Tenere traccia proattiva dell'integrità dei dati con la profilatura predefinita e gli avvisi che rilevano anomalie prima di raggiungere i consumer downstream.
Condivisione dei dati Condividere in modo sicuro i dati in tempo reale e gli asset di intelligenza artificiale tra organizzazioni e cloud usando il protocollo open Delta Sharing.
Governance dell'intelligenza artificiale Gestire gli asset di intelligenza artificiale e il traffico di intelligenza artificiale usando il catalogo unity e il gateway di intelligenza artificiale.

Get started

Le risorse seguenti consentono di iniziare a usare Unity Catalog. Se l'area di lavoro è stata creata dopo il 9 novembre 2023, viene abilitata automaticamente con Unity Catalog.

Topic Descrizione
Introduzione a Unity Catalog Controllare se Unity Catalog è già abilitato per l'area di lavoro e configurare il primo catalogo, lo schema e i controlli di accesso ai dati.
Aggiornare al catalogo Unity Informazioni su come aggiornare un'area di lavoro che non usa ancora Unity Catalog.

Risorse aggiuntive