Select Page

Una cosa es que los especialistas en marketing hablen de "la avalancha de datos". Otra cosa es que los profesionales de la tecnología, como los científicos de datos, se enfrenten a lo que se describe mejor como un "diluvio". Ya sea en producción, fabricación, marketing, aplicaciones de recursos humanos o servicio al cliente, está claro que los sistemas que administran y analizan la información están repletos de todo tipo de datos estructurados y no estructurados.

Y esos datos no solo están creciendo en volumen, sino también en complejidad. En el contexto de recursos humanos, cada empleado o trabajador temporal no solo aporta su propia información de perfil, como salario, beneficios, año de contratación y certificaciones, sino que también genera continuamente nuevos datos, incluidas las horas trabajadas, los proyectos completados y los resultados de la revisión del desempeño. .

Y más allá del volumen y la complejidad, también está la engañosamente simple cuestión del formato. No todos los datos son simplemente binarios: cada vez más, los sistemas deben poder escanear y analizar información de texto libre donde la terminología puede variar de un usuario a otro.

“Pasamos de una era en la que no teníamos conocimientos a la actualidad, en la que estamos impulsando una gran cantidad de conocimientos”, dijo Don Weinstein, vicepresidente corporativo de tecnología y productos globales de ADP. “Es como tomar a una persona hambrienta y llevarla a un buffet. La gente puede congelarse y no saber por dónde empezar”.

Más amplio y más profundo

El volumen de datos complejos permite a las organizaciones capturar más información de más fuentes y analizarla de más formas para más propósitos. Considere una empresa con 5000 empleados, sugiere John Sumser, consultor principal de la firma de asesoría HRExaminer del Área de la Bahía. Hoy, puede aplicar 20 modelos a cada individuo y otros varios cientos a cada departamento. Pero a medida que se expanden las capacidades del sistema, el impacto en los equipos de ciencia y tecnología de datos será "extraordinario", dijo.

Por un lado, continuó Sumser, las grandes organizaciones ejecutarán sus modelos en lo que él llama "granjas de modelos de datos" que contienen todos sus datos operativos. A medida que la tecnología antigua alcance su capacidad y lleguen nuevas plataformas con capacidades mejoradas, los equipos técnicos tendrán que desarrollar nuevos modelos de datos mientras continúan ejecutando los existentes. Él compara el desafío con cambiar una llanta mientras el auto aún está en movimiento. “Tienes que estar evaluando la salud y la configuración de todas esas cosas al mismo tiempo”, dijo.

Para tener una idea de la escala involucrada, considere ADP. Según Weinstein, la empresa almacena hoy más de 3 petabytes de datos de la fuerza laboral, y ese conjunto de datos crece continuamente. La empresa procesa la nómina de 26 millones de empleados-clientes en los EE. UU., generalmente cada dos semanas, o 25 veces al año. “Estás hablando de 650 millones de cheques de pago y cada cheque de pago en sí mismo es un tesoro de datos”, observó Weinstein. “Y ese es solo el punto de partida”.

Tuercas y tornillos de datos

La gestión de la inteligencia artificial detrás de tales sistemas será un aspecto importante para hacer frente a este diluvio, cree Sumser. Sin embargo, anticipa que los tecnólogos y los profesionales de datos se encontrarán con una serie de dificultades operativas al mismo tiempo. Por ejemplo, brindar a los expertos en reclutamiento la mejor tecnología será especialmente desafiante cuando los tipos de datos y sistemas que necesitarán sean objetivos móviles.

E, inevitablemente, las condiciones comerciales cambiarán, lo que a su vez afectará el gasto. Un escenario posible: las ventas de una empresa caen, por lo que debe dejar de gastar en un sistema de análisis predictivo del que dependen sus operaciones. Cuando suceda algo así, “habrá creado una situación en la que la empresa es vulnerable”, dijo Sumser. El personal de datos habrá creado un cierto nivel de expectativas que no pueden permitirse mantener, y habrán hecho promesas que no podrán cumplir. Entonces “va a haber mucho que pagar, y eso le va a pasar a mucha gente”, observó Sumser.

Mientras tanto, los datos solo se vuelven más complicados. Por ejemplo, si bien la cantidad de datos de nómina con los que trabaja ADP es enorme, la mayoría son "contables" y "binarios", dijo Weinstein. Sin embargo, gran parte de la información utilizada en la gestión de la fuerza laboral no es tan sencilla: "Las calificaciones de desempeño, el logro de objetivos y cosas de esa naturaleza son desordenadas".

Los datos desordenados pueden ser peligrosos. Involuntariamente o no, sin la experiencia adecuada en el lugar, puede ser mal utilizado. “Solo porque puse una encuesta y obtuve un montón de respuestas, en realidad no significa nada”, dijo Weinstein. De hecho, él cree que muchas afirmaciones falsas se hacen “porque hay personas sin experiencia que usan instrumentos de datos de manera inapropiada”.

Eso lleva a otro desafío para usar los datos de la fuerza laboral de manera efectiva, según Weinstein: separar la señal del ruido. “Hay tanto ruido y hay muy poca señal verdadera, verdadera”, dijo. “Tienes todas estas diferentes encuestas que están siendo lanzadas, y son solo un montón de cosas cualitativas disfrazadas de datos cuantitativos y verificables que no tienen un respaldo o base real en la ciencia o el descubrimiento científico. Eso no es bueno."

¿Qué se está ahogando en los datos?

Con tantos datos producidos y acumulados cada minuto, las marcas pueden comenzar a ahogarse en datos. Dicho esto, no todos los datos son valiosos o procesables, por lo que las marcas deben poder discernir cuál es cuál. "Las empresas no se están ahogando en datos por su profundidad, se están ahogando porque no saben nadar.

¿Por qué las empresas y organizaciones se ahogan en datos?

Esto se debe a que muchas empresas no cuentan con un sistema de análisis para evaluar sus datos en busca de información significativa. Solo con información relevante sobre los clientes, los proveedores de servicios y los productos, una empresa puede identificar las acciones que necesita tomar para adquirir, servir y retener a sus clientes.

Por qué tener una estrategia de datos

Una estrategia de datos ayuda al garantizar que los datos se administren y utilicen como un activo. Proporciona un conjunto común de metas y objetivos en todos los proyectos para garantizar que los datos se utilicen de manera eficaz y eficiente.

Video: drowning in data