23 mayo 2010

Fundamentos de SSIS (SSIS for beginners) – Cargando Archivos de Texto

Continuando con el regreso a las bases con SQL Server Integration Services, comparto con ustedes dos videos que muestran el uso del manejo de archivos de texto de SSIS, tanto para cargarlos a una tabla o base de datos, renombrar un archivo o simplemente moverlo a otro folder.

 

Si no pueden visualizar los videos aquí, pueden visitar http://www.vimeo.com/11690495 y http://www.vimeo.com/11700552 respectivamente.

Alan

Fundamentos de SQL Server Integration Services (SSIS for beginners)

Hace algunas semanas me pidieron alguna información básica de cómo empezar a trabajar con SSIS. Así que desde aquel momento estuve con la idea de volver a las bases y preparar algo bien básico que pueda servirle a personas que recién empiezan o están considerando utilizar SSIS para resolver algún problema de negocios.

A continuación presento el primer video de la serie la cual cubre los aspectos más básicos de SSIS.

Si por algún motivo no pueden ver el video en esta página pueden visitar http://www.vimeo.com/11514816.

 

Alan

SQL Server Fast Track

El jueves pasado, Puerto Rico PASS (PRPASS) contó con dos invitados de lujo, José Muñoz y Ramón Ponte de Microsoft Puerto Rico. Quienes respectivamente presentaron los temas de SQL Server Fast Track y SQL Server Parallel Data Warehouse.

El objetivo de este post es hacerles un breve resumen de la sesión explicando básicamente qué es SQL Server Fast Track detalle de cómo se implementa. En un post posterior espero hacer lo propio con SQL Server Parallel Data Warehouse.

SQL Server Fast Track

¿Qué es?

SQL Server Fast Track (Fast Track) es un conjunto de referencias y mejores prácticas para acelerar la implantación (deployment) de nuestro Data Warehouse relacional logrando el máximo desempeño de SQL Server de manera costo efectiva. Este conjunto de referencias está orientada de acuerdo al hardware específico que tengamos o estemos pensando en adquirir. De esto modo, Fast Track se busca convertir en la referencia fundamental que nos oriente a la hora de elegir el hardware requerido para implementar nuestro Data Warehouse de acuerdo a nuestras necesidades de desempeño (transacciones por segundo).

La gráfica a continuación muestra en líneas punteadas el ámbito que ocupa Fast Track dentro de lo que sería una solución de Business Intelligence completa.

image

Es importante aclarar que Fast Track NO se dirige a la optimización de sistemas transaccionales (OLTP), ya que en su naturaleza de utilizar los recursos, principalmente almacenamiento, son totalmente distintos: un Data Warehouse basa la gran mayoría de sus procesos en lectura, mientras que un sistema trasaccional en la escritura.

Aunque hay varios factores dentro de la ecuación para obtener el mejor rendimiento (performance) de nuestro servidor de SQL, Fast Track basa sus recomendaciones en balancear el poder de procesamiento con la capacidad de almacenamiento (input/output – IO). 

Adicionalmente, Fast Track incluye mejores prácticas para la organización (layout) de los datos, carga y administración. La versión actual de Fast Track es la 2.0 que cubre SQL Server 2008.

Volumen de datos

De acuerdo a la documentación, Fast Track 2.0 está orientado a Data Warehouse de 4 a 48 Terabytes.

Cómo funciona

El equipo de Fast Track en conjunto con sus socios de negocios de hardware, han desarrollado un conjunto de pruebas en laboratorios controlados, simulando cargas estándares de un típico Data Warehouse, basados en el Decision Support Benchmark (TCP-H) del Transaction Processing Performance Council (www.tpc.om). De acuerdo a estas pruebas se han creado varias arquitecturas de referencia (reference architectures) de acuerdo al fabricante y modelo del hardware, que especifican los componentes relacionados y su configuración para lograr el mejor rendimiento balanceado de nuestro Data Warehouse. La versión actual (2.0) de Fast Track incluye referencias para HP, Dell, Bull, EMC e IBM. Por tanto si van a iniciar un nuevo proyecto de Data Warehouse de alto volumen de datos y aún no han decidido qué hardware comprar, definitivamente deben revisar las guías de referencia de su fabricante de preferencia. Hay ofrecimientos de cada fabricante para 2, 4 y 8 procesadores, para un máximo de 48 cores para manejar 48 Terabytes de datos. A continuación las configuraciones de referencia existentes:

image

La clave para elegir con cuál configuración trabajar, es el conocer los requerimientos de nuestro Data Warehouse de acuerdo al volumen de datos que se va a manejar y los tiempos de respuesta esperados. Fast Track incluye herramientas para ayudarnos a entender nuestra necesidad como el Fast Track Core Calculator. El resultado de principal de usar nuestra calculadora será entre varias cosas será el número de cores que necesitamos y el máximo volumen de datos que podremos manejar con ese número de cores. A partir de aquí entonces ya podemos llamar a nuestro fabricante y comenzar a negociar la configuración requerida.

De acuerdo a la información revisada, SQL Server Fast Track, ofrece el mejor valor en términos de costo basado en hardware común versus los competidores.

A continuación los dejo con una lista de referencias importantes para que puedan revisar mayores detalles acerca de SQL Server Fast Track:

Alan