Interface DataProfilingConfig

Data Profiling Configurations.

interface DataProfilingConfig {
    analysisConfig?:
        | { $case: "inferenceLog"; inferenceLog: InferenceLogConfig }
        | { $case: "timeSeries"; timeSeries: TimeSeriesConfig }
        | { $case: "snapshot"; snapshot: SnapshotConfig };
    assetsDir?: string;
    baselineTableName?: string;
    customMetrics?: DataProfilingCustomMetric[];
    dashboardId?: string;
    driftMetricsTableName?: string;
    effectiveWarehouseId?: string;
    latestMonitorFailureMessage?: string;
    monitoredTableName?: string;
    monitorVersion?: bigint;
    notificationSettings?: NotificationSettings;
    outputSchemaId?: string;
    profileMetricsTableName?: string;
    schedule?: CronSchedule;
    skipBuiltinDashboard?: boolean;
    slicingExprs?: string[];
    status?: DataProfilingStatus;
    warehouseId?: string;
}

Index

Properties

analysisConfig? assetsDir? baselineTableName? customMetrics? dashboardId? driftMetricsTableName? effectiveWarehouseId? latestMonitorFailureMessage? monitoredTableName? monitorVersion? notificationSettings? outputSchemaId? profileMetricsTableName? schedule? skipBuiltinDashboard? slicingExprs? status? warehouseId?

Properties

`Optional`analysisConfig

analysisConfig?:
    | { $case: "inferenceLog"; inferenceLog: InferenceLogConfig }
    | { $case: "timeSeries"; timeSeries: TimeSeriesConfig }
    | { $case: "snapshot"; snapshot: SnapshotConfig }

(--[Create:REQ Update:REQ]--) Analysis config which is used to determine analysis logic.

Type Declaration

{ $case: "inferenceLog"; inferenceLog: InferenceLogConfig }
- $case: "inferenceLog"
- inferenceLog: InferenceLogConfig
  Analysis Configuration for monitoring inference log tables.
{ $case: "timeSeries"; timeSeries: TimeSeriesConfig }
- $case: "timeSeries"
- timeSeries: TimeSeriesConfig
  Analysis Configuration for monitoring time series tables.
{ $case: "snapshot"; snapshot: SnapshotConfig }
- $case: "snapshot"
- snapshot: SnapshotConfig
  Analysis Configuration for monitoring snapshot tables.

`Optional`assetsDir

assetsDir?: string

Field for specifying the absolute path to a custom directory to store data-monitoring assets. Normally prepopulated to a default user location via UI and Python APIs.

`Optional`baselineTableName

baselineTableName?: string

Baseline table name. Baseline data is used to compute drift from the data in the monitored table_name. The baseline table and the monitored table shall have the same schema.

`Optional`customMetrics

customMetrics?: DataProfilingCustomMetric[]

Custom metrics.

`Optional`dashboardId

dashboardId?: string

Id of dashboard that visualizes the computed metrics. This can be empty if the monitor is in PENDING state.

`Optional`driftMetricsTableName

driftMetricsTableName?: string

Table that stores drift metrics data. Format: catalog.schema.table_name.

`Optional`effectiveWarehouseId

effectiveWarehouseId?: string

The warehouse for dashboard creation

`Optional`latestMonitorFailureMessage

latestMonitorFailureMessage?: string

The latest error message for a monitor failure.

`Optional`monitoredTableName

monitoredTableName?: string

Unity Catalog table to monitor. Format: catalog.schema.table_name

`Optional`monitorVersion

monitorVersion?: bigint

Represents the current monitor configuration version in use. The version will be represented in a numeric fashion (1,2,3...). The field has flexibility to take on negative values, which can indicate corrupted monitor_version numbers.

`Optional`notificationSettings

notificationSettings?: NotificationSettings

Field for specifying notification settings.

`Optional`outputSchemaId

outputSchemaId?: string

ID of the schema where output tables are created.

`Optional`profileMetricsTableName

profileMetricsTableName?: string

Table that stores profile metrics data. Format: catalog.schema.table_name.

`Optional`schedule

schedule?: CronSchedule

The cron schedule.

`Optional`skipBuiltinDashboard

skipBuiltinDashboard?: boolean

Whether to skip creating a default dashboard summarizing data quality metrics.

`Optional`slicingExprs

slicingExprs?: string[]

List of column expressions to slice data with for targeted analysis. The data is grouped by each expression independently, resulting in a separate slice for each predicate and its complements. For example slicing_exprs=[“col_1”, “col_2 > 10”] will generate the following slices: two slices for col_2 > 10 (True and False), and one slice per unique value in col1. For high-cardinality columns, only the top 100 unique values by frequency will generate slices.

`Optional`status

status?: DataProfilingStatus

The data profiling monitor status.

`Optional`warehouseId

warehouseId?: string

Optional argument to specify the warehouse for dashboard creation. If not specified, the first running warehouse will be used.

Interface DataProfilingConfig

Index

Properties

Properties

OptionalanalysisConfig

Type Declaration

$case: "inferenceLog"

inferenceLog: InferenceLogConfig

$case: "timeSeries"

timeSeries: TimeSeriesConfig

$case: "snapshot"

snapshot: SnapshotConfig

OptionalassetsDir

OptionalbaselineTableName

OptionalcustomMetrics

OptionaldashboardId

OptionaldriftMetricsTableName

OptionaleffectiveWarehouseId

OptionallatestMonitorFailureMessage

OptionalmonitoredTableName

OptionalmonitorVersion

OptionalnotificationSettings

OptionaloutputSchemaId

OptionalprofileMetricsTableName

Optionalschedule

OptionalskipBuiltinDashboard

OptionalslicingExprs

Optionalstatus

OptionalwarehouseId

Settings

On This Page

`Optional`analysisConfig

`Optional`assetsDir

`Optional`baselineTableName

`Optional`customMetrics

`Optional`dashboardId

`Optional`driftMetricsTableName

`Optional`effectiveWarehouseId

`Optional`latestMonitorFailureMessage

`Optional`monitoredTableName

`Optional`monitorVersion

`Optional`notificationSettings

`Optional`outputSchemaId

`Optional`profileMetricsTableName

`Optional`schedule

`Optional`skipBuiltinDashboard

`Optional`slicingExprs

`Optional`status

`Optional`warehouseId