넷마블

AI 엔지니어(VLM /음성 에이전트) 모집

2년 이상 · 근무지 미기재 · 정규직 · 마감 2026-12-31

진행 중

Python AI

지원하기 넷마블 다른 공고

한눈에 보기

경력 2년 이상

근무지 미기재

근무형태 미기재

고용형태 정규직

지원 시작 2026-05-30

지원 마감 2026-12-31

핵심 기술 Python, AI

전형 10단계 안내

전형 안내

* 직무에 따라 코딩테스트, 사전과제가 있을 수 있으며 별도 안내 예정입니다.

* 2차 면접 이후 필요 시 평판조회가 진행될 수 있으며, 지원자의 사전 동의를 받고 진행됩니다.

* 각 전형의 결과는 지원하신 메일로 합격 및 불합격 안내 드릴 예정입니다.

전형 일정: * 직무에 따라 코딩테스트, 사전과제가 있을 수 있으며 별도 안내 예정입니다. * 2차 면접 이후 필요 시 평판조회가 진행될 수 있으며, 지원자의 사전 동의를 받고 진행됩니다. * 각 전형의 결과는 지원하신 메일로 합격 및 불합격 안내 드릴 예정입니다.

상세 내용

채용 공고

고용형태

- 정규직(수습 3개월)

직무별 상세 안내

* 아래 상세 직무 중 본인의 역량에 적합한 직무 한 곳을 선택하여 지원해 주시기 바랍니다.

VLM 기반 게임 에이전트 담당자

음성 에이전트 담당자

업무내용

Game Auto Play Agent
: 비전 기술 기반으로 다음 행동을 결정하고 제어
QA Agent
: QA 자동화 에이전트
게임 콘텐츠 분석
: Multimodal AI 기술을 활용한 콘텐츠 분석
AI Agent 고도화
: 성능개선을 위한 프롬프트, 플래닝,
툴 사용, 자기 검증 체계 고도화

지원자격

AI Agent, 자연어 처리(NLP), Vision, Multimodal AI 등
분야에서 2년 이상의 연구 또는 서비스 개발 경험
(관련 석/박사 연구 기간 포함)
Python 기반 모델 개발, 실험, 평가, 파이프라인 구현 경험
LLM/VLM을 활용한 APP 또는 Agent 설계/구현 경험
AI Coding Agent 활용 역량 보유
(Claude code, codex 등)
복잡한 문제를 논리적으로 정의하고
주도적으로 해결할 수 있는 역량 보유
연구 결과를 실제 제품 또는 서비스 적용하는데
관심과 경험 보유

우대사항

AI에이전트, 자연어처리, 음성AI 분야 석/박사 학위 보유자
VLM·멀티모달 모델의 파인튜닝, 평가, 추론 활용 경험
LLM/VLM 경량화 또는 가속화 경험
LLM/VLM 기반 서비스 또는 기능을 상용화한 경험
UI 기반 에이전트 또는 Computer Use Agent 개발 경험
(예: GUI grounding, screen understanding, action planning 등)
Top-tier AI 학회* 논문 발표 또는 수상 경력
* NeurIPS, ICML, ICLR, CVPR, EMNLP, AAAI 등
게임 도메인에 대한 이해 또는 관련 경험 보유

업무내용

보이스AI 서비스 개발
: Text-to-Speech (TTS), Voice Conversion,
Voice Agent 등
AI 응용 기술 연구 및 상용화
: 게임 개발, 운영 등 다양한 분야 적용 서비스

지원자격

음성 분야에서 2년 이상의 연구 또는 서비스 개발 경험
(관련 석/박사 연구 기간 포함)
딥러닝 프레임워크로 모델 설계 및 학습하고,
추론을 직접 수행한 경험 (PyTroch 등)
딥러닝 및 신호처리, 음운론에 대한 이해 보유
(Transformer, Diffusion, STFT, Prosody 등)
다국어(Multi-lingual) / 다화자(Multi-speaker)
TTS 모델 개발/고도화 경험
AI coding agent 활용 역량
(claude code, codex 등)
복잡한 문제를 논리적으로 정의하고,
주도적으로 해결하는 역량 보유
연구 결과를 실제 제품 또는 서비스 적용하는데
관심과 경험 보유

우대사항

음성AI, AI에이전트 분야 석/박사 학위 보유자
AI 관련 Top-tier 학회·저널*에 논문 발표 또는 수상 경력
* ICASSP, Interspeech, NeurIPS, ICLR, ICML, TASLP 등
오픈 소스 기여 이력
(PyTorch, HuggingFace, ESPNet 등)
Flow Matching 및 Diffusion,
LLM 기반 TTS 모델 연구 및 개발 경험
Nueral vocoder (BigVGAN, Vocos 등) /
Nueral audio codec (Encodec, DAC 등) /
Neural decompose-synthesis (DDSP, NANSY 등)
구현 및 실험 경험
Emotion controllable 음성 합성 모델 개발/고도화 경험
실시간(Streaming) 음성 합성 시스템 개발 및
latency 최적화 경험
게임 도메인 이해 또는 관련 경험

근무장소

- 서울시 구로구 디지털로 26길 38 G타워

AI 엔지니어(VLM /음성 에이전트) 모집

한눈에 보기

전형 안내

상세 내용

고용형태

직무별 상세 안내

근무장소

같이 보면 좋은 공고

게임 보안 운영/게임 보안 개발자 모집

AI 연구 및 서비스 개발(AI에이전트/HCI) 채용

개발 3본부 PM 담당 모집

몬길: STAR DIVE PM 모집