Pentaho Bi Open Source - V2

23
PENTAHO BI (Open Source) Introducción Taller Técnicos PENTAHO – Junio 2011

Transcript of Pentaho Bi Open Source - V2

PENTAHO BI (Open Source)Introducción

Taller Técnicos PENTAHO – Junio 2011

Introducción a Pentaho BI: Enterprise & Community.

Componentes de la Plataforma Pentaho Reporting Análisis de Datos (Mondrian – JPIVOT) Dashboard Pentaho Data Integration Data Mining - WEKA

Instalación y Administración de Pentaho BI Comunity: Consola administrativa:

Definición de Datasource Usuarios y Roles Repositorio

Consola de Usuario  Taller Pentaho Junio 2011

UNNOBA

¿Qué es Business Intelligence? “Inteligencia de Negocios es el proceso de

convertir datos en conocimientos y el conocimiento en acción, para la toma de decisiones”

DATOS ANÁLISIS CONOCIMIENTO

Tecnologías involucradas: Data Warehouse Reporting Análisis OLAP (On-line Analytical Processing) Dashboards Integración de datos (ETL – Extract, Transform and load) Minería de datos

Taller Pentaho Junio 2011UNNOBA

Círculo virtuoso de la información

DATOS ANÁLISIS

Taller Pentaho Junio 2011UNNOBA

¿Qué pasó? - ¿Qué pasa ahora? - ¿Por qué pasó? - ¿Qué pasará?

Beneficios

ATOS ANÁLISIS CONOCIMIENTO

Crear un círculo virtuoso de la información ( datos – información – mejores decisiones – generan nuevos datos)

Permite una visión única, histórica, persistente y de calidad de la información.

Crear, manejar y mantener KPI (indicadores de rendimiento) y KGI (indicadores de metas).

Aporta información actualizada. Reduce la brecha de orientación de negocios entre el

departamento de IT y la organización. Mejorar la competitividad como resultado de ser capaces

de: Diferenciar lo relevante de lo superfluo Acceder más rápido a la información Tener mayor agilidad en la toma de decisiones.

Taller Pentaho Junio 2011UNNOBA

¿Cuándo es necesaria la inteligencia de negocio?

ATOS ANÁLISIS CONOCIMIENTO

La toma de decisiones es realizada en forma intuitiva.

Se detectan problemas de calidad de información.

Excel Caos = uso intensivo de Excel como herramienta de análisis. Cada usuario con un archivo personalizado, por lo que la información es inconsistente entre las áreas y el costo de sincronización elevado.

Necesidad de cruzar información entre áreas.

Se ha alcanzado una masa crítica de datos.

Es necesario automatizar los procesos de extracción y distribución de la información.Taller Pentaho Junio 2011

UNNOBA

¿Cómo detectar que no existe una estrategia de BI?

ATOS ANÁLISIS CONOCIMIENTO

Los usuarios identifican al departamento de IT como origen de sus problemas de inteligencia de negocios.

El nivel jerárquico más alto considera que BI representa otro centro de costo.

El departamento de IT continúa preguntando a los usuarios finales sobre las necesidades de los reportes.

El sistema de BI está soportado por una Mesa de Ayuda No es posible medir el uso del sistema de BI No hay un plan para desarrollar, contratar, retener y aumentar

el equipo de BI. No existe un responsable funcional (o bien el asignado no es el

adecuado). Existen múltiples soluciones que repiten funcionalidad. Alguien cree que es un éxito que la información consolidada

esté disponible a los usuarios finales al cabo de 2 semanas.

Los usuarios creen que la información en el DW no es correcta.Taller Pentaho Junio 2011UNNOBA

Fases de un Proceso BI

DATOS ANÁLISIS

Taller Pentaho Junio 2011UNNOBA

Fase 1: recolectar los requerimientos de información específicos Fase 2: extraer de las diferentes fuentes de información. Fase 3: se integran y cargan los datos en crudo en un formato

utilizable para el análisis. Fase 4: se obtendrán las respuestas a las preguntas, mediante la

creación de reportes, indicadores de rendimiento, cuadros de mando, gráficos estadísticos, etc.

Fase 5: explorar los datos de manera sencilla e intuitiva.

¿Porqué Open Source BI?

DATOS ANÁLISIS

Taller Pentaho Junio 2011UNNOBA

La solución elegida debería ser evaluada según los siguientes criterios: Adaptabilidad a todos los entornos. Sin costos de licencias Independencia del proveedor Garantías de permanencia. Upgrades y mejoras

frecuentes Tendencia a la calidad y utilización de

estándares (XML – MDX) Dedicación full a los servicios y a la solución de

negocios. Gran aprovechamiento de Web Services. La comunidad del software libre

Plataforma Pentaho Open Source BI

DATOS ANÁLISIS

Taller Pentaho Junio 2011UNNOBA

Características más importantes: Aplicación web desarrollada en J2EE. Modular. Servidor Web: puede correr en servidores

compatibles con J2EE como JBOSS AS, WebSphere, Tomcat, WebLogic y Oracle AS.

Base de datos: vía JDBC, DB2, Microsft SQL Server, MySQL, Oracle, PostgreSQL, Firebird, etc.

Sistema operativo: Multiplataforma. Repositorio de datos basado en XML. Todos los componentes están expuestos vía

Web Services Incluye: ETL, Reporting, OLAP, Data mining,

Dashboards, etc. Licencia: GNU GPL.

Plataforma Pentaho Open Source BI

DATOS ANÁLISIS

Taller Pentaho Junio 2011UNNOBA

Estrategia “open core”: a partir de un núcleo open source se ofrecen servicios y módulos mejorados.

Existen dos versiones disponibles de Pentaho:

Pentaho Community EditionPentaho Community EditionCompletamente gratuita

Pentaho Enterprise EditionPentaho Enterprise EditionSe ofrece bajo modalidad de subscripción

Plataforma Pentaho Open Source BI

DATOS ANÁLISIS

Taller Pentaho Junio 2011UNNOBA

Pentaho Community EditionPentaho Community EditionV

ersión comunitaria, sin costos de licencia, sin servicios de soporte asociados.

Es una suite completa con todas las funcionalidades necesarias para el correcto desarrollo de proyectos de BI.

AfPentaho soló la recomienda para:

Aficionados al BI Académicos Programadores de Software Abierto

Es totalmente software de código abierto, la licencia en su mayoría bajo la versión GNU.

http://community.pentaho.com/

Plataforma Pentaho Open Source BI

DATOS ANÁLISIS

Taller Pentaho Junio 2011UNNOBA

Pentaho Enterprise EditionPentaho Enterprise Edition

Versión empresarial, sin costos de licencia.

Tiene asociados servicios de soporte y mantención que se pagan a través de una suscripción anual.

Es una versión certificada que además posee algunas funcionalidades mejoradas para la consola de administración, y para la construcción de tableros de control.

http://www.pentaho.com

Componentes de la Plataforma

DATOS ANÁLISIS

Taller Pentaho Junio 2011UNNOBA

Componentes de la Plataforma

DATOS ANÁLISIS

Taller Pentaho Junio 2011UNNOBA

Existen productos con diferentes enfoques y dirigidos a diferentes tipos de usuarios. Pentaho Report Designer: Contiene dos

componentes: Un editor basado con prestaciones

profesionales destinado a desarrolladores. Un Wizard que facilita el trabajo y permite a

los usuarios obtener resultados de forma inmediata. Está destinada a usuarios con menos conocimientos técnicos.

Web ad-hoc Reporting: es un Wizard vía Web basado en metadatos que extiende la capacidad de los usuarios finales para la creación de informes sencillos.

Pentaho Reporting

Componentes de la Plataforma

DATOS ANÁLISIS

Taller Pentaho Junio 2011UNNOBA

Carácterísticas Generales: Modelado Multi Dimensional de Datos:

Utiliza MONDRIAN como servidor OLAP de tipo ROLAP.

El modelo de los cubos se guarda en archivos XML Lenguaje de consulta MDX

Navegación y Exploración de Datos: utiliza JPIVOT, el cual permite análisis Ad-Hoc de los

cubos de Mondrian. Este componente como otros puede ser reemplazado

por otras soluciones que se integran a Pentaho, p.e. PAT

Pentaho Análisis OLAP de Datos

Componentes de la Plataforma

DATOS ANÁLISIS

Taller Pentaho Junio 2011UNNOBA

Pentaho Análisis OLAP de Datos

Componentes de la Plataforma

DATOS ANÁLISIS

Taller Pentaho Junio 2011UNNOBA

Todos los componentes del modulo Pentaho Reporting y Pentaho Analysis (JPIVOT) pueden formar parte de un Dashboard. Identificación de Indicadores (KPI’s, Key

Performance Indicators) Monitoreo / Métricas

Investigar detalles subyacentes Drill a reportes de soporte

Seguimiento de excepciones Alertas basadas en reglas del negocio

Pentaho Dashboard

Componentes de la Plataforma

DATOS ANÁLISIS

Taller Pentaho Junio 2011UNNOBA

Poderosa herramienta de ETL (Extracción, Transformación y Carga del DW).

Entorno gráfico de desarrollo . Multiplataforma Basado en dos tipos de objetos: Transformaciones

(colección de pasos en un proceso ETL) y trabajos (colección de transformaciones)

Incluye cuatro herramientas: SPOON: para diseñar transformaciones usando el

entorno gráfico PAN: para ejecutar transformaciones diseñadas con

SPOON. CHEF: para crear trabajos KITCHEN: para ejecutar trabajos

Pentaho Data Integration

Componentes de la Plataforma

DATOS

Taller Pentaho Junio 2011UNNOBA

Se utiliza para: Descubrir patrones ocultos y correlaciónales en los

datos Prevenir eventos futuros basados en patrones

históricos

Data Mining - WEKA

Instalación

DATOS ANÁLISIS

Taller Pentaho Junio 2011UNNOBA

¿Qué necesitamos descargar para poder ver la solución propuesta? El servidor BI:

http://sourceforge.net/projects/pentaho/files/Business%20Intelligence%20Server/3.6.0-stable/ Biserver-ce-3.6.0-stable.zip para Windows Biserver-ce-3.6.0-stable.tar.gz para Linux

El motor Postgresql 8.3 o superior y su correspondiente JDBC

Pentaho Data Integration 4.1.0:http://sourceforge.net/projects/pentaho/files/Data%20Integration/4.1.0-stable/ Pdi-ce-4.1.0-stable.zip para Windows Pdi-ce-41.0-stable.tar.gz para Linux

Instalación

DATOS ANÁLISIS

Taller Pentaho Junio 2011UNNOBA

Al descomprimir el bi-server tendrán los siguientes directorios:

Pentaho/administrationconsole/biserver-ce/

Necesitarán configurar la siguiente variable de entorno: SET JAVA_HOME= /pentaho/biserver-ce/tomcat/jre

en windows Y copiar el driver jdbc de postgresql a:

C:\pentaho360\administration-console\jdbc en Windows

Verificar que también esté el driver en: c:\pentaho360\biserver-ce\tomcat\lib en

Windows

Referencias Bibliográficas y Otros…. Introducción al Business Intelligence – Josep Curto Díaz – ISBN: 978-84-

9788-886-8 – Mayo 2010

Pentaho 3.2 Data Integration – María Carina Roldán - ISBN 978-1-847199-54-6 – 2010

“Proyecto de implementación de un Data Warehouse para universidades nacionales “ - Trabajo Final De Grado - Del Giudice Glenda, Della Mea (principalmente el Anexo 1)

Toda la documentación producida por el Ing. Darío Bernabeu.

Pentaho Solutions Business Intelligence and Data Warehousing with Pentaho and MySQL – Parte III - Roland Bouman, Jos van Dongen - ISBN: 978-0-470-48432-6

http://kettle.pentaho.org/ de la Community.

http://Sourceforge.net/projects/pentaho/filesTaller Pentaho Junio 2011 UNNOBA