Mejoras de Integration Services en SQL 2012

¿Qué es Integration Services?

Es una herramienta que permite obtener datos de diversas fuentes, transformarlos y cargarlos a bases de datos, hojas de trabajo, archivos de texto u otro destino que sea compatible con OLE-DB.

Historia

En las versiones SQL Server 7 y 2000, las capacidades de ETL (Extracción, Transformación y Carga) eran provistas por Data Transformation Services (DTS)

A partir de SQL Server 2005, Microsoft decidió que la gran variedad de innovaciones implementadas en la nueva versión justificaban el nuevo nombre. Como resultado surgió SQL Server Integration Services (SSIS)

Mejoras en la versión 2012 de SSIS

Cambios generales en la interfaz

1.       Caja de herramientas de SSIS

La caja de herramientas de SSIS te permite agregar treas y componentes del flujo de data a un paquete, en vez de usar la caja de herramientas de Visual Studio, que se utiliza en versiones anteriores. Además incluye una descripción para el ítem que está seleccionado. También incluye dos categorías: Favoritos y Común.

2.       Parámetros

El diseñador del paquete incluye una nueva lengüeta para abrir la ventana de los parámetros para un paquete. Los parámetros permiten que usted especifique los valores en tiempo de ejecución para el paquete, el contenedor, y las propiedades de la tarea o las variables.

3.       Botón de variable

Este nuevo botón en la barra de herramientas del diseñador del paquete proporciona el acceso rápido a la ventana de las variables.

 4.       Botón de Caja de herramientas de SSIS

Este botón permite que usted abra la caja de herramientas de SSIS cuando no es visible.

5.       Comenzando (Getting Started)

Proporciona el acceso a los enlaces de los vídeos y los ejemplos que usted puede utilizar para aprender a trabajar con Integration Services.

6.        Control de Acercamiento (Zoom control)

Usted puede acercar o alejar a un tamaño máximo de 500 por ciento de la visión normal o a un tamaño mínimo del 10 por ciento, respectivamente.

 7.       Administrador de Conexiones Compartidas (Shared Connection Managers)

La carpeta Administrador de Conexiones es un nuevo contenedor que puede ser compartido entre múltiples paquetes. Para crear un nuevo Administrador de Conexiones compartidas siga los siguientes pasos:

  1. Presione el botón de la derecha del ratón sobre la carpeta Administrador de Conexiones y selecciones la opción Nuevo Administrador de Conexiones.
  2. En la pantalla de Administración de Conexiones seleccione el tipo de conexión deseado y presione el botón Añadir.
  3. Provea la información requerida en el editor correspondiente al tipo de Administración de Conexión seleccionado y presione OK para salir.

 

8.       Deshacer y Rehacer (Undo / Redo)

Estas opciones fueron añadidas como parte de las herramientas de datos de SQL Server. A través de esta opción se puede editar el control de flujo o flujo de datos y revertir o reaplicar los cambios. Estas opciones también funcionan en la ventana de variables, en el manejador de eventos y parámetros. Se puede utilizar Ctrl+Z para Deshacer o Ctrl+Y para reaplicar.

9.       Paquetes ordenados por Nombre

Los paquetes pueden ser ordenados por nombre al presionar el botón de la derecha del ratón sobre la carpeta Paquetes de SSIS.

 

10.   Indicador de estatus

La interfaz del usuario ahora presenta íconos en la esquina superior derecha de cada ítem para indicar si la ejecución fue exitosa o fallida.

Control de flujo

1.       Tarea de Expresión

El propósito de esta tarea es el facilitar la asignación de un valor dinámico a una variable.

 

2.       Tarea de Ejecución de Paquete

Esta tarea incluye una nueva propiedad llamada Tipo de Referencia que permite especificar la localización del paquete a ser ejecutado. Si se selecciona Referencia del Proyecto, usted podrá seleccionar el paquete hijo desde una lista. Si se selecciona Referencia Externa, usted podrá configurar la ruta del paquete hijo como se hacía en versiones anteriores.

Flujo de Datos

Entre las mejoras se encuentran:

1.       Los Asistentes para la selección de fuentes y destinos.

2.       Transformaciones de Merge y Merge Join

Estas transformaciones permiten recolectar datos de dos fuentes y producir una sola salida de los resultados combinados. La versión actual se ajusta automáticamente a las presiones de memoria.

 

3.       Transformación de Limpieza de Datos para DQS

Es un nuevo componente que se usa en conjunto con Data Quality Services (DQS)El propósito es ayudar a mejorar la calidad de los datos a través de reglas establecidas para el dominio de los datos. Se pueden crear reglas para hacer pruebas a los datos por errores comunes como errores de escritura en un campo tipo texto o asegurar que el largo de una columna cumple con las especificaciones.

 

4.       Grupo que puede ser Colapsado

Permite consolidar los componentes del flujo de datos en grupos que pueden expandir o colapsar. Para crear un grupo, siga los siguientes pasos:

  1. En el diseñador de flujo de datos, utilize el ratón para seleccionar los componentes que quiere combinar en un grupo.
  2. Presione el botón de la derecha del ratón y seleccione “Group”.
  3. Presione la flecha ubicada a la derecha del nombre del grupo para colapsarlo.

Transferencia del Proyecto (Deployment)

En SSIS 2012 se utiliza un proyecto el cual es almacenado en un archivo con la extensión ISPAC. El proyecto es una colección de paquetes y parámetros. Usted puede transferir el proyecto a un catálogo de Integration Services. A diferencia de versiones anteriores donde se utilizaban configuraciones, en esta versión se utilizan parámetros para asignar valores a las propiedades del proyecto en tiempo de ejecución. Antes de ejecutar un paquete, se debe crear un objeto de ejecución en el catálogo y opcionalmente asignarle valores a los parámetros o hacer referencia al ambiente del objeto de ejecución.

El catálogo de SSIS esencialmente es una aplicación de SQL (una base de datos del usuario en una instancia de SQL con un conjunto de procedimientos almacenados y un API de T-SQL.

Creación del catálogo

El instalar Integration Services no crea automáticamente el catálogo. Para crear el catálogo hay que realizar los siguientes pasos:

1)      En SQL Server Management Studio, conéctese a la instancia, presione el botón de la derecha del ratón sobre la carpeta de Integration Services en el Explorador de Objetos y seleccione Crear el Catálogo.

2)      En la pantalla de Creación del Catálogo, seleccione la opción de habilitar la integración CLR. Esta opción es requerida para administrar la funcionalidad de Integration Services.

3)      Opcionalmente se puede seleccionar la opción de Ejecución automática de Procedimientos Almacenados de Integration Services. Este procedimiento almacenado realiza una operación de limpieza cuando el servicio se ejecuta y ajusta el estatus de los paquetes que fueron ejecutados cuando el servicio es detenido.

4)      El nombre de la base de datos no puede ser cambiado (SSISDB) así que como paso final se requiere proveer una contraseña compleja y presionar OK. La contraseña crea una llave maestra a nivel de base de datos que es utilizada por Integration Services para cifrar los datos sensitivos que han sido almacenados en el catálogo.

Herramientas para detección de fallas y bitácoras

Los reportes de Integration Services localizados en SQL Server Management Studio proveen información a cerca de los resultados de ejecución de los paquetes en las últimas 24 horas. Estos incluyen información de rendimiento y mensajes de error para el caso de los paquetes fallidos.

 Cambios en el formato de los paquetes

La meta de estos cambios fue el facilitar la lectura e identificar más fácilmente las diferencias cuando se trabaja con sistemas de control de fuentes.

Formato de SSIS 2008                                                                                               

Formato de SSIS 2012

Resumen

Unos de los cambios mayores es la introducción del modelo de proyecto para simplificar los cambios a los valores del paquete en tiempo de ejecución. Un beneficio de este modelo es el catálogo. El catálogo almacena información a cerca de paquetes, validaciones, y resultados de ejecución en tablas que pueden ser consultadas a través de vistas o de reportes. El acceso a la información nos provee de una gran visibilidad de Integration Services lo cual no era posible realizar fácilmente en versiones anteriores.

 

 

“Las opiniones e ideas expresadas en este blog son las de los Autores y no necesariamente declaran o reflejan la opinión de Microsoft”