banner
Centro de Noticias
Amplia experiencia y metodologías avanzadas

Photobox desarrolla una imagen mucho más clara de la observabilidad

Aug 29, 2023

Photobox está utilizando la plataforma de observabilidad Dynatrace para consolidar todos los datos de monitoreo de su sistema en un solo panel. La imprenta personalizada, que ahora forma parte del grupo albelli-Photobox, presentó la plataforma antes de la fusión a finales de 2022.

Anteriormente, a la empresa le resultaba difícil adoptar un enfoque proactivo ante los problemas del sistema. El personal de TI de la empresa tuvo que monitorear una pila de tecnología compleja construida en AWS EC2 y microservicios que se ejecutan en Kubernetes y AWS Lambda.

Según Alex Hibbitt, director de ingeniería de albelli-Photobox Group:

La compleja pila fue creada por una serie de fusiones y adquisiciones. Ese nivel de complejidad se vuelve increíblemente difícil de observar de manera efectiva. Teníamos al menos cinco plataformas de observabilidad diferentes, utilizando alrededor de 10 tecnologías diferentes. La observabilidad se convirtió en una habilidad que sólo poseían unos pocos de nuestros ingenieros realmente experimentados.

Hibbitt recuerda que los problemas de TI podrían tardar hasta cuatro horas en identificarse. Mientras tanto, la naturaleza compleja de la observabilidad hizo que fuera un proceso difícil de llevar a cabo. Dice que la falta de observabilidad efectiva creó desafíos de escalabilidad y capacidad de respuesta:

Fue muy difícil para nosotros responder a un problema. Si algo sucediera, necesitaríamos contactar a nuestros mejores solucionadores de problemas y hacer que sintieran en el éter y dijeran: 'Oh, se siente como si estuviera en algún lugar por aquí'. Ese enfoque no fue muy científico.

Ha cambiado las reglas del juego para nosotros en términos de la capacidad de responder a los problemas dentro de nuestra compleja pila y nuestra capacidad de aplicar conocimientos sobre dónde centramos nuestros esfuerzos de ingeniería.

La empresa reconoció que necesitaba adoptar un rumbo diferente. Como primer intento, la empresa introdujo su propia herramienta de observabilidad. Sin embargo, esta tecnología hecha a medida sólo añadió otra capa de complejidad en lugar de crear valor. En ese momento, Photobox empezó a hablar con proveedores de tecnología sobre una posible solución al problema. Hibbit dice:

Reunimos una lista de deseos de lo que queríamos: una única herramienta que pudiera cubrir todo, desde servicios de bases de datos de front-end hasta back-end. Queríamos democratizar el acceso a la plataforma, para que cualquier ingeniero pudiera retomar el proceso y entender lo que estaba haciendo. Y necesitábamos algo que ayudara a nuestra relación señal-ruido, para poder ver qué alertas eran realmente importantes.

Después de utilizar la lista de deseos para identificar posibles soluciones, Photobox completó pruebas de bajo nivel con algunos proveedores. Luego, el equipo de Hibbitt realizó una prueba piloto de larga duración con su solución preferida, Dynatrace. Debido a la complejidad de los sistemas que se ejecutan en Photobox, la empresa estableció una prueba paga de seis meses para probar la plataforma y generar datos significativos a fines de 2021:

Como resultado de la prueba, lo pusimos en marcha en todos nuestros entornos de producción. Esa transición fue simplemente para conectarse con una implementación a más largo plazo. Uno de nuestros puntos de prueba principales fue: "¿Teníamos la confianza para apagar todas nuestras plataformas antiguas y confiar únicamente en Dynatrace?" La respuesta fue "sí", y ahora es una parte fundamental de nuestra tecnología.

Hibbitt dice que la introducción de las capacidades de automatización y AIOps de Dynatrace ha producido grandes beneficios. Photobox ha reducido el tiempo medio de resolución de problemas en un 80% y ha reducido en un 60% el número de incidentes críticos que afectan la disponibilidad del servicio durante los períodos pico de compras. Uno de los beneficios clave del enfoque Dynatrace son las tarjetas de problemas de la plataforma:

Las tarjetas reúnen todas las diferentes métricas relacionadas que podrían haber salido mal en un incidente y las presentan como una visión holística. Hace dos cosas realmente interesantes. Primero, le da una idea de cuántos clientes se ven afectados por un problema, lo que ayuda a nuestros ingenieros a cuantificar si algo es realmente importante. En segundo lugar, realiza un análisis de la causa raíz, donde identifica el problema potencial. Y en una organización distribuida basada en microservicios como la nuestra, eso es increíblemente útil.

Todos los equipos de ingeniería de la organización utilizan Dynatrace. En lugar de simplemente reaccionar ante los problemas, utilizan la plataforma para trabajar de forma proactiva y comprender dónde centrar sus esfuerzos de forma más eficaz como equipos de ingeniería:

Tuvimos problemas como pérdidas de memoria que habían existido en nuestra pila durante cuatro o cinco años, que habían impactado el recorrido del cliente pero estaban ocultas en nuestro mar de productos de observabilidad.

Photobox también se beneficia de información en tiempo real sobre cómo los clientes interactúan con los servicios y cómo los problemas de rendimiento podrían afectar las ventas. La implementación original de Dynatrace se centró en plataformas web, pero la organización de TI ahora también está observando las propiedades móviles. Hibbit dice:

Hemos podido rastrear y resolver problemas de larga data en nuestras aplicaciones. Y, una vez más, estamos obteniendo un valor comercial realmente bueno al comprender nuestros embudos de ventas y conversiones, y al descubrir áreas donde los clientes podrían pensar que nuestras aplicaciones no son óptimas.

El recientemente formado grupo albelli-Photobox tiene grandes planes para seguir mejorando. El objetivo es crear una plataforma de observabilidad holística que cubra ambas organizaciones como parte de un ecosistema masivo. La clave del éxito será garantizar que todos los miembros del nuevo grupo comprendan el papel de la plataforma Dynatrace, afirma Hibbit:

La observabilidad es un problema complejo, con un conjunto de principios que comprender. La gente suele confundir seguimiento y observabilidad. Ha habido un gran trabajo dentro de la comunidad de Photobox sobre la plataforma y ahora necesitaremos repetir ese trabajo con la comunidad de Albelli, para ayudar a definir la diferencia entre un buen monitoreo y una buena observabilidad.

Crédito de la imagen: Pixabay