SQL Server 2008 (7): Wie verwende ich die Data Profiling Task?

Data Profiling, das heißt das Untersuchen von Eigenschaften unbekannter Daten, ist eine neue Funktionalität in SQL Server 2008 (ab CTP5). Da die Verwendung in der aktuellen CTP nicht wirklich offensichtlich ist hier eine Kurzanleitung.

Voraussetzungen: Die Daten sind in SQL Server (also vorher importieren) und der Zugriff erfolgt über eine ADO.NET Verbindung mit Hilfe von .NET Providers\SQLClient.

Dann ist der Ablauf wie folgt:

  1. Erstelle in BI Development Studio ein neues Integration Services Projekt
  2. Füge dem erzeugten Paket die Data Profiling Task hinzu
  3. Füge eine neue ADO.NET (!!!) Connection auf eine SQL Server Quelle hinzu
  4. Gehe auf die Eigenschaften der Profiling Task und wähle „Quick Profile“
  5. Wähle Verbindung und Tabelle aus
  6. Wähle die gewünschten Profile aus (bei Candidate Key gibt’s bei mir in der aktuellen CTP Probleme, ich deselektiere das immer)
  7. Füge als Ziel eine neue FileConnection hinzu (Dateiname.xml)
  8. Führe das Paket aus
  9. Öffne DataProfileViewer.exe aus dem DTS\Binn Verzeichnis
  10. Lade die .xml-Datei

Mehr dazu in meiner SQL Server 2008 kurz und knapp Webcastreihe am 24.1.

Hier noch 2 Bilder:

Quick Profile Auswahl:
DataProfiling1

Ergebnis:
DataProfiling2

Gruß,
Steffen