Ingeniería de datos
Desarrollamos soluciones de ingeniería de datos orientadas a alto volumen, alto procesamiento, en batch o en tiempo cercano a real; incluyendo cualquier tipo de fuente o formato, además de ajustarnos al método de recolección que resulte más eficiente, ya sea API’s, servicios, web, open data o accesos directos a bases de datos. Hemos desarrollado métodos propios para facilitar el entendimiento de datos en la etapa de integración. Adicionalmente, las arquitecturas consideran la automatización de los procesos, con gobierno, administración y control completo de los datos.
Algunas de nuestras soluciones: procesos de integración de datos (ELT/ETL), arquitecturas de colección donde se origina el dato (EDGE), framework completo de integración (modular y reutilizable para homologar todos los procesos de recolección, integración y preparación de datos de la empresa).
Streaming de datos
Desarrollamos soluciones de streaming o de ingesta continua de datos a destinos diversos incluyendo DATA LAKE, aplicando transformaciones al vuelo que permiten ofrecer, además de la centralización de la información, indicadores listos para ser usados en la capa de análisis de información. La plataforma Cloudera Data Flow permite desarrollar flujos de ingesta continuos altamente escalables por medio de la interfaz gráfica de desarrollo.
Soluciones analíticas basadas en grafos
Las soluciones basadas en grafos tienen la particularidad que le dan el mismo peso al nodo que a las relaciones entre nodos. Los grafos permiten desarrollar soluciones analíticas en la mitad del tiempo que lleva usar técnicas de data mining tradicional y son soluciones de alto desempeño. Una ventaja significativa en las soluciones con grafos es que no existe un esquema fijo, por lo que el modelo inicial puede evolucionar con el tiempo sin necesidad de reconstruir o modificar lo que ya existe, lo que da agilidad para ingestar más datos a la solución sin que exista reconstrucción o reconfiguración de los procesos actuales. Asimismo, una solución basada en grafos permite visualizar e interpretar los resultados desde el momento mismo de creación de los modelos. Desarrollamos sistemas de recomendación, vistas reales 360, o capacidad de modelar topologías o procesos complejos de negocio.
Analítica predictiva
La ciencia de datos nos permite, por medio de métodos especializados en minería de datos, grafos y aprendizaje de máquina, desarrollar soluciones para resolver problemas, entender mejor el comportamiento de nuestros datos, o generar soluciones de aprendizaje automatizado e impactar los resultados operativos de la empresa. Analizamos tus datos con nuestras plataformas Cloudera, Pentaho o Neo4j para encontrar patrones de comportamiento de usuarios o predecir escenarios en los que algún producto o servicio funciona de manera inadecuada o se puede ver comprometido (como en situaciones de: vandalismo, mantenimiento predictivo, tendencias de usuarios, salud de equipos, etcétera).
Data operations (Data OPS)
La operación y mantenimiento de las plataformas, así como el método de realizar ajustes a los procesos o aplicaciones de datos es tan o más importante que el desarrollo mismo. Pero operar y mantener requiere conocimiento profundo de las tecnologías y los procesos, además de entender los roles y procesos de negocio a los que responden los procesos de datos implementados. Operamos y mantenemos plataformas Big Data considerando los componentes de la plataforma de software, los procesos y los casos de uso de manera completa e integrada. Ejecutando acciones de monitoreo, acciones preventivas y correctivas, además de tener un método para ejecutar cambios al desarrollo sobre las plataformas productivas