Aplicaciones de BI con Pentaho

45
2das Jornadas de Data Mining UTN FFRO Noviembre 2011 www.datalytics.com Aplicaciones de BI con @aEyherabide Ing. Andrés Eyherabide

description

Presentación "Aplicaciones de BI con Pentaho", dada por Datalytics en la segunda edición de las Jornadas de Minería de Datos organizadas por la cátedra de Sistemas de Gestión 2 de la UTN Regional Rosario

Transcript of Aplicaciones de BI con Pentaho

Page 1: Aplicaciones de BI con Pentaho

2das Jornadas de Data Mining – UTN FFRO – Noviembre 2011 www.datalytics.com

Aplicaciones de BI con

@aEyherabide

Ing. Andrés Eyherabide

Page 2: Aplicaciones de BI con Pentaho

Datalytics es una empresa de servicios profesionales independiente, orientada

exclusivamente a las prácticas de:

Data Integration

Business Intelligence

Data Mining

Fundada en el año 2007.

Oficinas en las ciudades de Buenos Aires y Medellín.

Nuestros servicios incluyen la consultoría, capacitación, implementación y el apoyo

necesario para asegurar una solución exitosa que soporte los procesos de negocios.

+20 profesionales de diversas áreas

Datalytics ha certificado su Sistema de Gestión de calidad para la “Provisión de

Servicios de Business Intelligence y Data Mining” bajo la norma ISO 9001:2008 por

Bureau Veritas.

La Empresa

Page 3: Aplicaciones de BI con Pentaho

Nuestros Servicios

Siebel PeopleSoft SAP R/3 XML

VSAM MQSeries AS/400

DB2 UDB Informix Oracle Microsoft ...

Archivos Planos FTP

Web Logs

DW OLAP & Reporting

DW ODS Data Mart

Extract Transform Clean Load

ETL

Data Mining

Datastage Informatica Oracle DI Pentaho DI SAS DIS Etc.

SAS, SPSS, Rapid Miner

Pentaho, Oracle/Hyperion, Microstrategy, SAS, Etc.

Oracle IBM DB2 SQL Server Teradata Sybase IQ Etc.

Page 4: Aplicaciones de BI con Pentaho

Consultoría y diseño de estrategias de BI.

Implementación de Soluciones de Business Intelligence.

Capacitación y cursos oficiales de Pentaho.

Integración de Datos de múltiples fuentes y migración desde aplicaciones legacy.

Procesos de limpieza, estandarización y normalización de datos de sistemas

existentes o fuentes de datos externas (bases de clientes, prospects, etc).

Utilización de herramientas de BI para la mejora de procesos y soluciones no

tradicionales como:

Conciliación inteligente de cuentas (bancarias, títulos valores, acciones, ...).

Herramienta de gestión de Fuerza de Ventas.

Solución de gestión de evaluaciones de desempeño.

Implementación/reingeniería de herramientas de planeamiento colaborativo.

Desarrollo de modelos de Data Mining.

Nuestras Soluciones

Page 6: Aplicaciones de BI con Pentaho

Pentaho Partnership

Primer y único Platinum Reseller, Systems Integration and Training Partner en

América Latina.

Partners desde Marzo 2008

Oferta de cursos oficiales y a medida, presenciales y vía web.

Más de 40 instalaciones realizadas en 6 países.

Más de 15 consultores especializados en la Plataforma.

Implementaciones en varios países de Latinoamérica en clientes de distinta

escala.

Page 7: Aplicaciones de BI con Pentaho

BI propietario

SAP compra a Sybase por USD 5.800 Millones

SAP compra a BO por USD 6.800 Millones

IBM compra a SPSS por USD 1.200 Millones

IBM compra a Netezza por USD 1.700 Millones

IBM compra a Cognos por USD 4.900 Millones

Oracle compra a Hyperion por USD 3.300 Millones

Page 9: Aplicaciones de BI con Pentaho

Open Source en todas partes

“Para el 2012, el 80% de todo software

comercial incluirá algún elemento Open Source”

“Hay variedad de herramientas/software open source en un estadío maduro,

estable y bien soportadas. Ellas proveen una significativa oportunidad para

vendedores y usuarios de bajar el costo total de ownership e incrementar el

ROI.”

“Ignorar esta realidad pondrá a las compañías en una sería posición de

desventaja competitiva. Embeber sofware Open Source se convertirá en la

inversión mínima que muchos grandes vendors encontrarán necesaria para

mantener su ventaja competitiva durante los próximos 5 años.”

Gartner Group, año 2008

Page 10: Aplicaciones de BI con Pentaho

Open Source en el mundo BI

5 años después, los megavendors de BI le hicieron caso al Grupo Gartner.

SAP/Business Objects:

Apache Tomcat, MySQL, Eclipse, Python, Subversion, etc…

IBM/Cognos:

Apache Tomcat, Apache Derby, PostgreSQL, iSeries Appliance (Talend)

Greenplum:

PostgreSQL, Proyecto R, Map/Reduce

Information Builders:

Magnify (Lucene), Rstat (Proyecto R), Open Portal Services (Apache Jetspeed)

Page 11: Aplicaciones de BI con Pentaho

Por qué Open Source?

Fuente: Open Source Adoption in the BI Market, 3rd Nature, 2009

Page 12: Aplicaciones de BI con Pentaho

Reduciendo Costos

“En un proyecto de 5 años, open source BI cuesta

82% menos que los BI Megavendors y 77% menos

que empresas dedicadas a BI” (Fuente: BI Platform Licensing Models and Negotiating Strategies, Abril 2010)

En un período de 3 años, la reducción de costos de Pentaho respecto a otros productos propietarios:

• Implementaciones Grandes (500 usuarios): 95% • Implementaciones Medianas (100 usuarios): 72% • Implementaciones Pequeñas (25 usuarios): 55%

(Fuente: Lowering the Cost of Business Intelligence With Open Source, 2010)

Page 13: Aplicaciones de BI con Pentaho

Adopción OSBI por módulos

Fuente: Open Source Adoption in the BI Market, 3rd Nature, 2009

50%

Page 16: Aplicaciones de BI con Pentaho

Que es Pentaho?

Pentaho es la empresa líder en

Commercial Open Source Business

Intelligence & Data Integration

Compañía americana fundada en 2004,

con HQ en Orlando (FL)

Modelo Low Cost y metodología ágil de

implementación, acelerando generación

de valor y ROI

Auspiciada por Benchmark Capital, Index

Ventures and NEA

+ de 160 partners, entre ellos algunas de

las empresas de tecnología más

innovadoras del mercado

Page 17: Aplicaciones de BI con Pentaho

Presencia internacional en aumento

+ 8.000 implementaciones en +185 países

+ 1.200 clientes

+400 nuevos clientes

en el 2010.

En promedio 1 descarga cada 30 segundos (!)

Page 18: Aplicaciones de BI con Pentaho

Q1 2009 Q2 2009 Q3 2009 Q4 2009 Q1 2010 Q2 2010 Q3 2010 Q4 2010

Las suscripciones se duplicaron el 2010

Page 19: Aplicaciones de BI con Pentaho

Q1 '09 Q2 '09 Q3 '09 Q4 '09 Q1 '10 Q2 '10 Q3 '10 Q4 '10 Q1 '11 Q2 '11 Q3 '11 Q4 '11

Proyección 2011

Page 20: Aplicaciones de BI con Pentaho

Liderazgo en Open Source BI

# 1 OS BI

# 1 en OS DI/ETL

# 2 en OS Data Mining

Fuente TDWI y BeyeNetwork

Page 21: Aplicaciones de BI con Pentaho

Modelo de negocio

Build

Test Contribute

Write

Enterprise Edition Open Source Community

Pentaho contrata los principales desarrolladores de cada módulo, y dirige el desarrollo de cada uno de los proyectos

La comunidad contribuye nueva funcionalidad, testeo e innovación

Lo anterior mejora la calidad del producto mediante la rápida detección de defectos

Software certificado, listo para ambientes de producción

Módulos exclusivos, funcionalidad adicional y facilidades de uso

Soporte técnico oficial

Modelo de suscripción que minimiza la inversión inicial

Page 22: Aplicaciones de BI con Pentaho

Desde los datos hasta el análisis…

Page 23: Aplicaciones de BI con Pentaho

… guiado por una metodología ágil

Single Development Environment

Page 25: Aplicaciones de BI con Pentaho

Acelerando la generación de valor

“Pentaho’s Agile BI initiative is a leap forward for the industry, and I expect businesses will be able to dramatically reduce the

time it takes for them to create and update BI applications.”

– Mark Smith, President

La misión de Agile BI es crear soluciones

de calidad de manera rápida y sencilla,

promoviendo la participación del

usuario final durante el desarrollo y

reduciendo los riesgos de desvíos en la

implementación.

Una plataforma integrada reduce los

tiempos de desarrollo.

Rápidas iteraciones promueven la

participación de los analistas de negocio.

La agilidad para adaptarse a nuevos

requerimientos y a un entorno

cambiante es vital para satisfacer las

necesidades del negocio.

Page 26: Aplicaciones de BI con Pentaho

Análisis de la información: la solución debe ser una herramienta que permita el

análisis de la información, y no simplemente un medio para descargar miles de

datos crudos sin valor agregado.

Disponibilidad: acceso vía web a información actualizada protegida con usuario

y contraseña desde cualquier lugar, 24x7.

Autoservicio: los usuarios deben poder acceder a la información y analizarla a

diferentes niveles de detalle, sin necesidad de recurrir al departamento de

sistemas o recursos informáticos especializados.

Ágil y evolutiva: la solución debe ser ágil, escalable y evolutiva, para acompañar

a la compañía en los cambios incorporando constantemente información de

nuevos sistemas, nuevos indicadores y permitir análisis cada vez de mayor valor

para la institución.

Conceptos claves

Page 27: Aplicaciones de BI con Pentaho

Pentaho está compuesta por un

conjunto de herramientas, una por cada

etapa de su proyecto de BI.

Estructura modular y embebible:

Data Integration

Pentaho Reporting

Pentaho Analysis

Pentaho Dashboards

Pentaho Data Minina

Arquitectura multiplataforma

Soporte para Mobile BI

Énfasis en Big Data (Hadoop, bases

analíticas, NoSQL, etc.).

Pentaho BA Suite

Page 28: Aplicaciones de BI con Pentaho

Pentaho Data Integration

Permite tomar información de diferentes fuentes, consolidarla y cargarla en un repositorio analítico.

Su entorno de trabajo visual y drag & drop se traduce en un menor tiempo de desarrollo y un mantenimiento más sencillo y agilidad para incorporar nuevas fuentes de información e indicadores.

Plug-in de Agile BI:

Data Discovery: Análisis y visualización de información en tiempo real

Data Modeling: Modelado y publicación de cubos OLAP

Page 29: Aplicaciones de BI con Pentaho

Pentaho Data Integration

+ de 150 steps para manipulación, enriquecimiento de datos y generación de reportes.

Repositorio integrado: control de versiones y scheduling.

Conectividad nativa contra:

Típicas: SQL Server, Oracle, DB2, Teradata, Sybase IQ, SAP, MySQL, PostgreSQL, etc.

No tan típicas: AS/400, Hadoop, LDAP/Active Directory, SalesForce, Google Analytics, etc.

Nuevos Features:

Soporte para MongoDB.

ElasticSearch.

Archivos HL7.

Capacidad de documentación automática.

cliente REST.

etc…

Page 30: Aplicaciones de BI con Pentaho

Portal Web

Los usuarios pueden acceder a la información mediante la web en cualquier momento, desde cualquier lugar con conectividad.

100% personalizable e integrable.

El Portal integra todos los módulos de la solución y provee servicios críticos para los usuarios como son:

Fácil acceso a información del negocio.

Análisis de tipo Ad-Hoc.

Scheduling de reportes de manera intuitiva.

Descarga de información. Análisis offline.

También provee servicios para administradores:

Administración de usuarios y seguridad.

Auditoria y monitoreo de rendimiento, etc.

.

Page 32: Aplicaciones de BI con Pentaho

Pentaho Report Designer

Conectividad con múltiples fuentes de información:

Bases de datos (SQL Server, Oracle, DB2,

Teradata, Sybase, …).

Transformaciones de Pentaho Data

Integration.

Otros: Metadata de Pentaho, OLAP

(XML/A, MDX), XML.

Principales Características:

Reportes pixel-perfect.

Desarrollo 100% drag & drop.

Utilización de parámetros y variables.

Posibilidad de descargar la información en

diversos formatos (html, pdf, xls, etc.).

Page 34: Aplicaciones de BI con Pentaho

Pentaho Interactive Reporting

Capacidad de los analistas de negocio de generar sus propios reportes operativos desde la web.

Selección de campos, totales por columna, filtros, ordenamiento, etc.

Posibilidad de descargar la información en diversos formatos (html, pdf, excel, etc.)

La Capa de negocios permite presentar la información a los usuarios en términos de negocio: los usuarios ven “Ventas” y “Clientes” en vez de CUST_TBLE u ORDR_TBLE.

Page 35: Aplicaciones de BI con Pentaho

Pentaho Analysis

Los cubos OLAP permiten a los usuarios visualizar la información de manera “dimensional”

Ejemplo: ventas por regional, por unidad de

negocio, por año fiscal.

Navegar y explorar la información de manera 100% intuitiva:

Análisis Ad-Hoc, Self-Service BI.

Drill-down, Drill-up.

Pivot, Slice and Dice.

Seleccionar miembros específicos para el

análisis.

Interactuar con un alto rendimiento:

Tecnología optimizada para manipular

grandes volumenes de información en seg.

Page 36: Aplicaciones de BI con Pentaho

Pentaho Dashboards

Dashboards interactivos en minutos.

El Usuario de negocio generan su propio Dashboard, sin interacción de perfiles técnicos.

Desarrollo amigable y 100% web.

Mashups de reportes & análisis en conjunto

con la generación gráficos nuevos.

Mashup de: Pentaho Reporting, Pentaho Analysis, Google Maps, websites, componentes AJAX, etc.

Generación de gráficos/tablas desde scratch utilizando el esquema de metadata centralizado de Pentaho.

Link entre objetos:

Dentro del mismo Dashboard

Entre Dashboards u otros reportes de Pentaho

Page 39: Aplicaciones de BI con Pentaho

Pentaho Data Mining

Manejo sencillo e intuitivo:

Modelado drag & drop

Ejecución de experimentos

Visualización gráfica

Funciones estadísticas y algoritmos:

Clustering y Segmentación.

Clasificaciones y regresiones.

Arboles de decisión y redes neuronales.

Soporte PMML.

Filtros predeterminados utilizables:

Discretización, normalización.

Muestreo, selección de atributos.

Transformación y combinación de atributos.

Page 40: Aplicaciones de BI con Pentaho

Pentaho Data Mining

Usuario: Data Miner

Page 41: Aplicaciones de BI con Pentaho

Enterprise Administration Console

Administración centralizada de la

plataforma:

Creación de usuarios y grupos:

Integración de seguridad con Active

Directory/LDAP.

Configuración de fuentes de información

Reportes de Auditoría.

Monitoreo de performance de la plataforma y actividad de usuarios.

Administración de backups.

Pentaho Data Integration Console:

Ejecución y monitoreo remoto de procesos ETL:

Análisis de tiempos, trends, históricos.

Configuración de umbrales de alerta

Page 42: Aplicaciones de BI con Pentaho

Enterprise Administration Console

Page 43: Aplicaciones de BI con Pentaho

Pentaho BA Suite

Desarrolladores

Analistas de Negocio

Analistas de Negocio

Mineros de Datos

Desarrolladores y DBAs

KPI interactivos, Métricas y

Visualizatción

Data Discovery y Ad-Hoc Análisis

Modelos Descriptivos y

Predictivos

Data Integration y Cleansing de Alta

Performance

Pentaho Reporting

Pentaho Dashboards

Pentaho Analysis

Pentaho Data Mining Optional Add-on

Pentaho Data Integration

Reportes Operacionales

Page 44: Aplicaciones de BI con Pentaho

Velocidad de Implementación

Time to market de 8 semanas

Time to market de 2 semanas

ROI menor a 1 mes Desarrollo e implantaicón en 90 días

Valor total

+ de €350K de ahorro en licencias

Costo de adquisición 75% menor

Innovación y escalabilidad

Archivos de + de 20 mil fuentes

Reporting operacional en 2.000 tiendas/sucursales

ROI alcanzado junto al Go Live

Brinda servicios a 2.500 brokers

Análisis de 500.000 historias clínicas

Servicios profesionales “… mejor

funcionalidad y mejor soporte”

“… soporte profesional world class”

“El soporte de Pentaho es tan bueno

como el soft”

“… un gran partner en cada fase de nuestro proyecto”

Ahorro de USD 600K

Por qué los clientes eligen Pentaho?

Page 45: Aplicaciones de BI con Pentaho

Muchas Gracias

www.datalytics.com

DatalyticsBI

@DatalyticsBI

http://blog.datalytics.com

Datalytics

Pentaho en español

2das Jornadas de Data Mining – UTN FFRO – Noviembre 2011