SQL para los programadores SAS - Introducción

12 de abril 2009 por: Blink 7

¿Qué es SQL?

SQL significa Lenguaje de consulta estructurado y fue diseñado para el desarrollo y mantenimiento dentro de un sistema de gestión de bases de datos (DBMS). Un DBMS consiste de una o más tablas de datos, por lo general se unieron en una forma jerárquica, y una serie de programas para organizar los datos.

Las tareas típicas realizadas con el código SQL son las siguientes:

  • Recuperar (o consulta) los datos de una o más tablas de datos
  • Manipular los datos dentro de las tablas existentes
  • Definir nuevas tablas de datos y crear dentro de la nueva tabla
  • ALTER TABLE definiciones existentes
  • Establecer permisos para los diferentes usuarios para acceder a las tablas existentes

La aplicación original de SQL fue desarrollada por IBM para manipular los datos de su sistema de R. Mientras que el lenguaje ha sido estandarizado por ANSI y la ISO, bases de datos más importante de extender la consulta SQL, basado en la sintaxis de lengua de procedimiento para incluir las construcciones como las instrucciones condicionales y variables de almacenamiento . Las extensiones suelen ser específicos para el DBMS, resultando en varias sub-lenguajes como PL / SQL (Oracle) y T-SQL (Microsoft SQL Server).

SAS implementa SQL mediante la instrucción PROC SQL. PROC SQL puede ser usado como una alternativa al paso DATA para crear y manipular conjuntos de datos, donde cada conjunto de datos SAS es tratada como una tabla. La mayoría de los comandos disponibles en el paso de datos pueden ser utilizados en PROC SQL, mientras que la declaración puede ser utilizada para controlar las variables macro y salida de la pantalla.

¿Por qué aprender SQL cuando SAS tiene el Paso DATOS?

La mayoría de los programadores de SAS ya están familiarizados con el paso DATA - posiblemente la declaración más importante en el lenguaje SAS. Así que, ¿por qué aprender otra declaración que realiza las mismas tareas? SQL ofrece muchas ventajas sobre el paso DATA y otras declaraciones, incluidas las siguientes:

  • Interoperabilidad. PROC SQL puede utilizarse para recuperar datos directamente de las fuentes que de otra forma serían inaccesibles para el paso DATA. Por ejemplo, el controlador de Oracle PIPE puede ser utilizado por PROC SQL para emitir paso a través de declaraciones directamente a una base de datos Oracle (Oracle a través de la sintaxis SQL) y recuperar los resultados para el medio ambiente SAS.
  • Las instalaciones de la fusión de datos de gran alcance. El lenguaje de programación SQL no requieren conjuntos de datos a ser ordenados antes de la fusión. La sintaxis para realizar las diversas fusiones (Inner Join, OUTER JOIN, LEFT JOIN, RIGHT JOIN) es relativamente simple en comparación con el paso DATA
  • Informes simplificados. Una única instrucción SQL puede recuperar datos de uno o más conjuntos de datos, un resumen de los datos y la salida de los resultados a la pantalla. Para realizar la misma tarea que requeriría al menos un paso de datos y una declaración PROC PRINT.

PROC SQL si es superior a la del paso DATA o viceversa es un debate religioso que bulle en, incluso entre los instructores de SAS durante las clases de formación. En la práctica, he encontrado que cada declaración se destaca en diferentes situaciones y que los proyectos más complejos implican el uso frecuente de ambas.

¿Qué beneficios potenciales pueden SQL proporcionan para el Universo SAS?

El comando PROC SQL proporciona un punto de entrada fácil para el gran número de programadores de SQL que no están familiarizados con SAS. Mientras que SAS se utiliza generalmente como un instrumento estadístico, existen instalaciones muy poderosa que haría SAS una atractiva plataforma para base de datos de otras aplicaciones relacionadas, tales como ETL y tratamiento de marco principal.

Del mismo modo, el aprendizaje de SQL puede beneficiar a la SAS-programador sólo mediante la introducción de una lengua que es casi siempre de la demanda fuera del universo de SAS y que los trabajos estén fácilmente disponibles. A pesar de las implementaciones de SQL exactas difieren entre las distintas bases de datos, los comandos básicos siguen siendo coherentes en casi todas las bases de datos.

El Proyecto

El siguiente tutorial se basará en los datos generados por una tienda de electrónica de ficción. Los principales datos establecidos / tabla se compone de 10 días a partir de datos de la transacción que contiene las siguientes piezas de información:

  • Unique ID de transacción
  • Fecha de la transacción
  • ID de empleado que hizo la venta
  • Forma de pago
  • Importe de la transacción

De acuerdo con las prácticas recomendadas de DBMS, el empleado y la información la forma de pago se almacenan en las tablas de transacciones como la identificación numérica. Dos mesas más de referencia han sido creados para proporcionar detalles adicionales sobre cada empleado y el método de pago.

Tutorial Índice

El SAS PROC SQL Tutorial consiste de las siguientes secciones --

Parte 1 - Extracción de datos
Parte 2 - Manipulación de datos (pronto disponible!)
Parte 3 - La combinación de datos (pronto disponible!)
Parte 4 - Técnicas Avanzadas (pronto disponible!)

Guardado en: Desarrollo, Tutoriales
Tags:

Deje una contestación

Captcha
Escribe las letras que ves arriba.