|
|
|
|
|
La integración de datos es el proceso de mover y asociar datos a través de los sistemas de
información de la empresa. Consiste básicamente en extraer los datos de diferentes fuentes de
origen (Bases de datos, ficheros, aplicaciones, servicios web, email, etc.), aplicarles transformaciones
(join, lookup, duplicación, cálculos, etc.) y transmitir los resultados a los sistemas de
destino.
Talend, el primer proveedor de software open source de integración de datos, pone la integración
de datos a disposición de todos los tipos de organizaciones (Grandes corporaciones, Pymes, etc.).
Las soluciones de Talend se conectan a todos los sistemas tanto en origen como en destino.
Soluciones de integración de datos
Las soluciones Open Source para la integración de datos de Talend cubren todas las necesidades de
integración de datos para organizaciones de todos los tamaños.
- Integración operacional de datos
En la mayoría de las organizaciones, se responde a la integración operacional de los datos
realizando programas para cada necesidad específica. La migración y
sincronización/duplicación de datos son las aplicaciones más comunes para la
Integración de datos operacionales.
- Migración de datos
Al actualizar a una nueva versión de una base de datos o de una aplicación, o al cambiar
a un nuevo sistema, por ejemplo, los datos necesitan ser preservados en este nuevo sistema. El
propósito de la migración de datos es transferir datos existentes a un nuevo ambiente.
Necesita transformar los datos a un formato conveniente para el nuevo sistema, mientras que se
preserva la información presente en el viejo.
- Sincronización de datos
Existen muchos casos en los sistemas de información en que los datos se administran de forma
independiente por múltiples aplicaciones o bases de datos. Sin embargo, es necesario
mantener la coherencia entre dichos sistemas. La necesidad de la sincronización de datos
puede ser permanente (sincronización entre los diferentes sistemas) o temporal (por ejemplo,
durante una migración). La sincronización de datos incluye todos los procesos que
mantienen sincronizados los datos entre las aplicaciones y las bases de datos.
- ETL para Business Intelligence y el Data Warehousing
Los procesos de ETL (extracción, transformación y carga) son los componentes más
críticos - y de valor añadido - de una infraestructura de Buisness Intelligence (BI).
Mientras que es normalmente invisible al usuario de la plataforma de BI, los procesos de ETL recuperan
los datos de todos los sistemas operacionales y los pre-procesan para las herramientas de análisis
y de reporting. La exactitud de toda la plataforma BI depende de los procesos de ETL.
Soluciones Talend
El producto se ofrece de diversas maneras para adaptarse a todas las necesidades:
- Talend Open Studio
Es hoy en día la solución de integración de datos más abierta, innovadora
y poderosa del mercado. Ofrece capacidades avanzadas que mejoran realmente la productividad de la
integración de los trabajos y de la escalabilidad para proporcionar una ejecución
óptima. Consta de tres aplicaciones principales (Business Modeler, Job Designer y Metadata
Manager), todo ello en un repositorio centralizado que permite compartir recursos entre todos los
desarrolladores de la plataforma de integración.
- Talend Open Profiler
La primera herramienta Open Source de profiling de datos. Permite examinar las diferentes fuentes
de datos existentes (por ejemplo bases de datos, aplicaciones,
archivos.) y recoger las estadísticas y la información sobre estos datos para luego
mostrar los resultados mediante informes o gráficos sofisticados. El profiling permite la
evaluación del nivel de calidad de los datos contenidos en el sistema de información.
- Talend Integration Suite
Talend Integration Suite es una plataforma de integración de datos con capacidades de ETL y
sincronización de datos. Es decir puede extraer información de distintos orígenes
de datos,
transformarla y unificarla en una base de datos de destino (DataWarehouse). Asimismo mediante ‘Jobs’
(Trabajos programados) puede garantizar la actualización permanente de dichos datos en el
Datawarehouse. La utilidad básica es tener un repositorio
centralizado de datos que sirva de base para alimentar las herramientas de reporting y análisis
de la empresa.
|
 |
|
|