miércoles, 25 de mayo de 2016

Planificación de Tareas en TM1



 Realizado por la SmartB Katherine Izquierdo

 Las tareas en TM1 son objetos que permiten automatizar la ejecución de uno o más procesos que son requeridos frecuentemente, evitando que el usuario tenga que ejecutar los procesos a demanda, ya que son ejecutados a través de la planificación de un Schedule para ejecutarla en un determinado tiempo.
A continuación mostraremos como planificar una tarea en pasos sencillos:
 
1.    Conéctese a IBM Cognos Architect. Presione clic derecho sobre Tareas, seleccione Crear Nueva Tarea

2.    Seleccione el proceso al cual desea asignarle la tarea, presione la flecha simple a la derecha si desea agregar una única tarea, o bien seleccione la flecha doble a la derecha para incorporar todos los procesos existentes. Para retirar los procesos seleccione la flecha simple  la izquierda y la flecha doble a la izquierda respectivamente. Especifique los valores de los parámetros. (Para este ejemplo no están activados, ya que el proceso seleccionado no requiere de ningún parámetro). Seleccione el modo de confirmación y por último presione el botón Siguiente para continuar.

3.    Configure el schedule de la tarea. Seleccione la fecha, hora y frecuencia con la que desea ejecutar el proceso. Marque la casilla Activar Tarea, seleccione el botón Finalizar. Indique el nombre con el que será guardada la tarea.


4.    Indique el nombre de la tarea. Es recomendable dar a la tarea el mismo nombre del proceso.

  
5.    Ahora puede visualizar la tarea planificada dentro de Tareas.

6.    Si lo desea puede correr la tarea a demanda. Presione clic derecho sobre la tarea y seleccione la opción Ejecutar.







miércoles, 11 de mayo de 2016

Metodología CRISP-DM - Parte I

Elaborado por la SmartB María Victoria Díaz


Para los proyectos de implementación de minería de datos, SMARTBASE GROUP sigue una metodología que se ha convertido en un estándar en la industria, se trata de CRISP-DM (correspondiente a las siglas en inglés de “Cross-Industry Standard Process for Data Mining”). Este estándar incluye un modelo y una guía, estructurados en seis fases que se comenzó a utilizar en Europa desde el año 1.997 por un grupo de empresas emprendedoras de soluciones de minería de datos (entre ellas SPSS en Inglaterra).

Los objetivos de esta metodología son:

- Aplicar y comprender de mejor manera a la Minería de Datos y sus resultados basándose en un proceso jerárquico.
- Dar cumplimiento de objetivos desde el punto de vista empresarial dando preferencia a la comprensión del negocio.
- Desarrollar proyectos de minería de datos mediante un proceso estandarizado.
- Minimizar los costos que implica un proyecto de minería de datos en las empresas

CRISP-DM, está dividida en 4 niveles de abstracción organizados de forma jerárquica, en tareas que van desde el nivel más general, hasta los casos más específicos y organiza el desarrollo de un proyecto de Data Mining, en una serie de seis fases, como se muestran a continuación:



Figura 1. Esquema de los 4 niveles de CRISP-DM ([CRISP-DM, 2000]).

La sucesión de fases no es necesariamente rígida. Cada fase es estructurada en varias tareas generales de segundo nivel. Las tareas generales se proyectan a tareas específicas, donde finalmente se describen las acciones que deben ser desarrolladas para situaciones específicas, pero en ningún momento se propone como realizarlas.


Figura 2. Modelo de proceso CRISP–DM ([CRISP-DM, 2000])

  A continuación se describen las dos primerass fases del CRISP-DM.

1. Fase de comprensión del negocio o problema
La primera fase de la guía de referencia CRISP-DM, denominada fase de comprensión del negocio o problema (figura 3), es probablemente la más importante y aglutina las tareas de comprensión de los objetivos y requisitos del proyecto desde una perspectiva empresarial o institucional, con el fin de convertirlos en objetivos técnicos y en un plan de proyecto. Sin lograr comprender dichos objetivos, ningún algoritmo por muy sofisticado que sea, permitirá obtener resultados fiables. Para obtener el mejor provecho de Data Mining, es necesario entender de la manera más completa el problema que se desea resolver, esto permitirá recolectar los datos correctos e interpretar correctamente los resultados. En esta fase, es muy importante la capacidad de poder convertir el conocimiento adquirido del negocio, en un problema de Data Mining y en un plan preliminar cuya meta sea el alcanzar los objetivos del negocio. Una descripción de cada una de las principales tareas que componen esta fase es la siguiente:

Determinar los objetivos del negocio. Esta es la primera tarea a desarrollar y tiene como metas, determinar cuál es el problema que se desea resolver, por qué la necesidad de utilizar Data Mining y definir los criterios de éxito. Los problemas pueden ser diversos como por ejemplo, detectar fraude en el uso de tarjetas de crédito, detección de intentos de ingreso indebido a un sistema, asegurar el éxito de una determinada campaña publicitaria, etc. En cuanto a los criterios de éxito, estos pueden ser de tipo cualitativo, en cuyo caso un experto en el área de dominio, califica el resultado del proceso de DM, o de tipo cuantitativo, por ejemplo, el número de detecciones de fraude o la respuesta de clientes ante la introducción de una nueva tarjeta de crédito.



Figura 3. Fase de compresión del negocio o problema

Evaluación de la situación. En esta tarea se debe calificar el estado de la situación antes de iniciar el proceso de DM, considerando aspectos tales como: ¿cuál es el conocimiento previo disponible acerca del problema?, ¿se cuenta con la cantidad de datos requerida para resolver el problema?, ¿cuál es la relación coste beneficio de la aplicación de DM?, etc. En esta fase se definen los requisitos del problema, tanto en términos de negocio como en términos de Data Mining.

Determinación de los objetivos de DM. Esta tarea tiene como objetivo representar los objetivos del negocio en términos de las metas del proyecto de DM, como por ejemplo, si el objetivo del negocio es el desarrollo de una campaña publicitaria para incrementar la asignación de créditos hipotecarios, la meta de DM será por ejemplo, determinar el perfil de los clientes respecto de su capacidad de endeudamiento.

Producción de un plan del proyecto. Finalmente esta última tarea de la primera fase de CRISP-DM, tiene como meta desarrollar un plan para el proyecto, que describa los pasos a seguir y las técnicas a emplear en cada paso.

2. Fase de comprensión de los datos


La segunda fase (figura 4), fase de comprensión de los datos, comprende la recolección inicial de datos, con el objetivo de establecer un primer contacto con el problema, familiarizándose con ellos, identificar su calidad y establecer las relaciones más evidentes que permitan definir las primeras hipótesis. Esta fase junto a las próximas dos fases, son las que demandan el mayor esfuerzo y tiempo en un proyecto de DM. Por lo general si la organización cuenta con una base de datos corporativa, es deseable crear una nueva base de datos ad-hoc al proyecto de DM, pues durante el desarrollo del proyecto, es posible que se generen frecuentes y abundantes accesos a la base de datos a objeto de realizar consultas y probablemente modificaciones, lo cual podría generar muchos problemas.


Figura 4. Fase de comprensión de los datos.

Las principales tareas a desarrollar en esta fase del proceso son:

Recolección de datos iniciales. La primera tarea en esta segunda fase del proceso de CRISP-DM, es la recolección de los datos iniciales y su adecuación para el futuro procesamiento. Esta tarea tiene como objetivo, elaborar informes con una lista de los datos adquiridos, su localización, las técnicas utilizadas en su recolección y los problemas y soluciones inherentes a este proceso.

Descripción de los datos. Después de adquiridos los datos iniciales, estos deben ser descritos. Este proceso involucra establecer volúmenes de datos (número de registros y campos por registro), su identificación, el significado de cada campo y la descripción del formato inicial.

Exploración de datos. A continuación, se procede a su exploración, cuyo fin es encontrar una estructura general para los datos. Esto involucra la aplicación de pruebas estadísticas básicas, que revelen propiedades en los datos recién adquiridos, se crean tablas de frecuencia y se construyen gráficos de distribución. La salida de esta tarea es un informe de exploración de los datos

Verificación de la calidad de los datos. En esta tarea, se efectúan verificaciones sobre los datos, para determinar la consistencia de los valores individuales de los campos, la cantidad y distribución de los valores nulos, y para encontrar valores fuera de rango, los cuales pueden constituirse en ruido para el proceso. La idea en este punto, es asegurar la completitud y corrección de los datos.

miércoles, 4 de mayo de 2016

Creación de un Data Source para cubos de TM1



                  Realizado por nuestro SmartB Gerardo Delgado

Si necesitas traer un cubo de Tm1 para efectuar reportes, es necesario crear un data source de tipo TM1. Esta tarea la puedes completar desde Cognos Administración o directamente desde el wizard en Framework Manager. Sigue estos pasos:

1.       En Cognos Administración vamos a la pestaña Configuraciones / Data Source / Nuevo



2.       Especificamos los datos (nombre, descripción, otros) del Data Source (DS)


 
3.       Seleccionamos el Tipo de DS. en este caso IBM Cognos TM1

 

4.       Definimos los campos para el String de Conexión. Donde “Administration Host” corresponde al nombre completo o dirección IP del servidor que tiene almacenados los servicios de Tm1. En “Server Name” ingresamos el nombre del servicio de Tm1 al cual queremos establecer conexión.


 
5.       Al probar la conexión asignamos un "Signon" que se pueda utilizar para el Grupo de Todos, es recomendable utilizar un usuario que cuente con muchos privilegios.



6.       Verificamos que la conexión es efectiva.



 7.       Finalmente guardamos el DS y verificamos que se creó.

 

Desde Framework Manager tenemos el mismo procedimiento a partir de ejecutar “Run Metadata Wizard”.
1.       Sobre el namespace, hacemos click derecho y ejecutamos “Run Metadata Wizard”.


 2.       Seleccionamos el origen para la Metadata.



3.       Seleccionamos un DS creado (Como se puede observar el DS creado anteriormente) o seleccionamos la opción de crear un Data Source Nuevo.




4.       Nos da la bienvenida al wizard para crear el DS, seleccionamos siguiente y se realizan los pasos antes explicados.


 
5.       Verificamos la creación del DS y lo seleccionamos para visualizar los cubos a publicarse.


 Importante destacar que para que el usuario pueda visualizar los cubos debe tener ciertos privilegios de seguridad asignados en Tm1 (sobre los cubos), también dichos cubos entre sus propiedades debe tener definida la dimensión de medida, caso contrario no permitirá el import y arrojara un error.