Data Scientist Middle

INFORMACION · Huixquilucan (Híbrido)

Inscribirme
o
Inscribirme

Descripción

Buscamos un Data Scientist Middle responsable de analizar, transformar y modelar datos para generar soluciones analíticas que apoyen la toma de decisiones del negocio. Participará en el desarrollo de modelos de similitud, optimización y procesamiento de información, trabajando con grandes volúmenes de datos en entornos cloud (GCP), asegurando calidad, eficiencia y claridad en la comunicación de resultados.

Requisitos

  • Experiencia práctica en desarrollo con Python 3.10+.
  • Experiencia en manipulación y análisis de datos con Pandas, Polars y NumPy
  • Experiencia en técnicas de NLP y similitud de texto
  • Conocimiento en modelado de problemas de optimización (ILP con PuLP/CBC)
  • Experiencia en entornos GCP, particularmente BigQuery y Google Cloud Storage
  • Capacidad para traducir requerimientos de negocio en soluciones técnicas
  • Deseable conocimiento en temas contables (impuestos y su aplicación)


Habilidades Técnicas Indispensables


  • Python avanzado (3.10+).
  • Manipulación avanzada de DataFrames (merge, groupby, apply, iterrows) con Pandas
  • Uso de Polars (operaciones lazy, expresiones y diferencias frente a Pandas)
  • Operaciones vectorizadas y manejo de tolerancias numéricas con NumPy
  • NLP con spaCy (modelo es_core_news_lg) y cálculo de similitud semántica por coseno
  • Vectorización TF-IDF y cosine similarity con scikit-learn
  • Formulación de problemas de optimización con Integer Linear Programming (ILP) usando PuLP/CBC
  • Consultas SQL en BigQuery (queries parametrizadas)
  • Lectura y escritura de archivos en Google Cloud Storage (CSV, Parquet, HTML)


Habilidades Técnicas Deseables


  • Experiencia adicional en proyectos de matching y conciliación de datos.
  • Optimización de rendimiento en procesamiento de grandes volúmenes de información.
  • Conocimiento en modelos de clasificación o clustering.
  • Experiencia en automatización de pipelines de datos.
  • Conocimiento funcional en procesos contables o financieros


Actividades


  • Analizar y transformar grandes volúmenes de datos utilizando Python y librerías especializadas
  • Diseñar e implementar modelos de similitud de texto y matching utilizando NLP y técnicas vectoriales
  • Formular y resolver problemas de optimización mediante ILP
  • Ejecutar consultas en BigQuery para extracción de datos transaccionales
  • Gestionar archivos en Google Cloud Storage (lectura/escritura en distintos formatos)
  • Colaborar con áreas de negocio para traducir requerimientos en soluciones analíticas
  • Documentar procesos y resultados analíticos.
  • Asegurar calidad y consistencia de los datos utilizados en los modelos.


Competencias Blandas


  • Comunicación efectiva para audiencias técnicas y no técnicas
  • Colaboración en equipo.
  • Proactividad y orientación a resultados