Científico de datos: ¿La profesión más sexy de la industria?

Share:
Juan Salvador Mármol Yahya, Científico de Datos en jefe en Business Data Evolution.

¿Qué es específicamente lo que hace un científico de datos, y por qué todas las organizaciones deberían contar con este tipo de colaboradores?

En octubre de 2012, Harvard Business Review tituló un artículo: “Data Scientist: El trabajo más sexy del siglo 21. Conozca a las personas que pueden obtener tesoros de datos desordenados y no estructurados”.

Poco más de una década después, los científicos de datos se han posicionado como unos de los especialistas más cotizados y buscados por todo tipo de organizaciones.

Esto a raíz de que la información y los datos se han convertido en el nuevo petróleo.

Para tener claro qué hace un científico de datos y saber de primera mano si es el trabajo más sexy de este siglo, charlamos con Juan Salvador Mármol Yahya.

Mármol es Científico de Datos en jefe en Business Data Evolution, compañía que nació hace siete años con el objetivo de utilizar los datos de sus clientes para ofrecerles soluciones que mejoren los objetivos que tienen.

La ciencia de datos es un campo multidisciplinario que combina habilidades en matemáticas, estadísticas, programación y conocimientos de dominio específico.

Este tipo de profesional capitaliza la información de que dispone todo tipo de empresa u organización para desarrollar hipótesis e inferencias; luego utiliza Machine Learning para detectar patrones, relaciones y tendencias dentro de esos datos.

De forma más terrenal, Mármol explica que se ocupan de evitar el “Good Feeling”, el “Me late”, el lanzamiento de dados o la costumbre en la toma de decisiones, por información o datos que las sustenten.    

“Una empresa que cuenta con los servicios de este tipo de profesionales puede aprovecharlos para reducir costos e incrementar ingresos al utilizar sus datos para brindar soluciones personalizadas”, afirmó.

Lee también: Bluetab forma científicos de datos

Lo que aporta

Business Data Evolution atiende a clientes de distintas industrias; resuelve problemas de empresas de los sectores financiero, manufacturero y retail, entre otros.

En finanzas ayuda a las organizaciones a predecir, por ejemplo, cuándo va a abandonar un cliente, tema estratégico si se contempla que es cuatro veces más caro conseguir un nuevo cliente que mantener uno que ya se tiene.

Aprovechando la información de que dispone este tipo de organizaciones y complementándola con la que tienen acceso, pueden identificar cuáles son los que tienen más alta probabilidad de abandonar.

“Tratamos de entender las razones por las que sería”, dijo.

En manufactura han hecho modelos para determinar por qué se presentan errores en algunos procesos productivos.

Eso ayuda a sus clientes a mejorar y les genera ahorros importantes.

En retail puede aplicarse para soportar sistemas de recomendación; para plantear cuál es el siguiente mejor producto que le conviene a la empresa recomendar a su cliente y los que generarán mayor rendimiento.

Con base en el valor del cliente potencial, recomendar el producto que le conviene ofrecer.

¿Cómo se llega a ese tipo de soluciones?

El Científico de Datos en jefe en Business Data Evolution explicó que utilizan la metodología CRISP  – DM, un proceso estándar de CRoss  Industry  para  minería de datos que sirve como base para un proceso de ciencia de datos.

Tiene seis fases secuenciales:

  1. Entendimiento del negocio – ¿Qué necesita el negocio?
  2. Comprensión de datos: ¿qué datos tenemos/necesitamos? ¿Está limpio?
  3. Preparación de datos: ¿cómo organizamos los datos para el modelado?
  4. Modelado – ¿Qué técnicas de modelado debemos aplicar?
  5. Evaluación: ¿Qué modelo cumple mejor con los objetivos comerciales?
  6. Implementación: ¿cómo acceden las partes interesadas a los resultados?

“Lo primero es establecer la pregunta de lo que le interesa resolver al cliente; muchas veces se empieza mal y se plantea lo que la ciencia de datos puede hacer por la empresa, sin entender qué es lo que realmente requiere”, explicó Marmol.

Al aplicar CRISP  – DM se identifica, entre otros aspectos, si es posible contestar su pregunta con los datos que tiene o enriquecerla con las distintas bases a las que el proveedor de servicios tiene acceso.

Se determina también si pueden ayudar al usuario a cambiar sus procesos y almacenar la información que es relevante.

Además de verificar la salud de los datos, porque muchas veces la base almacena mucha información, pero con vicios.

“Decimos que 80% consiste en la limpieza de los datos y el 20% restante es quejarnos del 80% inicial que tuvimos que estar limpiando”, bromeó.

Campo de oportunidades

El Científico de Datos recomendó a los desarrolladores de software y profesionales interesados en esta área laboral, mantenerse actualizados en sus conocimientos.

Tomar en cuenta que Inteligencias Artificiales Generativas como Chat GPT, Bard y otras, tienen la capacidad de generar código, pero siempre continuará siendo estratégico que un desarrollador experimentado esté al frente de los proyectos, realizando las preguntas correctas e infiriendo de la información a la que tenga acceso.

Ponderó que, en los últimos años, de acuerdo con información de distintas plataformas, el número de tareas relacionadas con ciencia de datos se incrementó un 295%, siendo mayor a la cantidad de especialistas que existen en el país para hacerles frente.

Los comentarios están cerrados.