24 días
Expira 25/12/2025
Senior Code Reviewer for LLM Data Training (Java)
Senior Code Reviewer for LLM Data Training (Java)
Acerca de la Empresa
G2i conecta expertos, estudiantes y profesionales con trabajos flexibles y remotos en capacitación de IA, incluyendo anotación, evaluación, verificación de hechos y revisión de contenido. Colaboramos con equipos de IA líderes, y todas las contribuciones son pagadas semanalmente tras aprobación, asegurando una compensación constante y confiable.
Sobre el Rol
Buscamos Code Reviewers con profunda experiencia en Java para revisar evaluaciones realizadas por anotadores de datos sobre respuestas de código Java generadas por IA. Su función es asegurar que los anotadores sigan estrictas pautas de calidad relacionadas con el cumplimiento de instrucciones, corrección fáctica y funcionalidad del código.
Responsabilidades
- Revisar y auditar evaluaciones de anotadores sobre código Java generado por IA.
- Evaluar si el código Java sigue las instrucciones del prompt, es funcionalmente correcto y seguro.
- Validar fragmentos de código utilizando la metodología de prueba de trabajo.
- Identificar inexactitudes en las calificaciones o explicaciones de los anotadores.
- Proporcionar retroalimentación constructiva para mantener altos estándares de anotación.
- Trabajar dentro de las pautas de Project Atlas para la integridad y consistencia de las evaluaciones.
Calificaciones Requeridas
- 5–7+ años de experiencia en desarrollo Java, QA o revisión de código.
- Fuerte conocimiento de sintaxis de Java, depuración, casos límite y pruebas.
- Cómodo utilizando entornos de ejecución de código y herramientas de prueba.
- Excelentes habilidades de comunicación escrita y documentación.
- Experiencia trabajando con flujos de trabajo QA o de anotación estructurados.
- Dominio del inglés a nivel B2, C1, C2 o nativo.
Calificaciones Preferidas
- Experiencia en capacitación de IA, evaluación de LLM o alineación de modelos.
- Familiaridad con plataformas de anotación.
- Exposición a pipelines de RLHF (Reinforcement Learning from Human Feedback).