넷마블

AI 엔지니어(VLM /음성 에이전트) 모집

2년 이상 · 근무지 미기재 · 정규직 · 마감 2026-12-31

진행 중

한눈에 보기

경력 2년 이상
근무지 미기재
근무형태 미기재
고용형태 정규직
지원 시작 2026-05-30
지원 마감 2026-12-31
핵심 기술 Python, AI
전형 10단계 안내

전형 안내

* 직무에 따라 코딩테스트, 사전과제가 있을 수 있으며 별도 안내 예정입니다.

* 2차 면접 이후 필요 시 평판조회가 진행될 수 있으며, 지원자의 사전 동의를 받고 진행됩니다.

* 각 전형의 결과는 지원하신 메일로 합격 및 불합격 안내 드릴 예정입니다.

전형 일정: * 직무에 따라 코딩테스트, 사전과제가 있을 수 있으며 별도 안내 예정입니다. * 2차 면접 이후 필요 시 평판조회가 진행될 수 있으며, 지원자의 사전 동의를 받고 진행됩니다. * 각 전형의 결과는 지원하신 메일로 합격 및 불합격 안내 드릴 예정입니다.

상세 내용

채용 공고

고용형태

  • - 정규직(수습 3개월)

직무별 상세 안내

* 아래 상세 직무 중 본인의 역량에 적합한 직무 한 곳을 선택하여 지원해 주시기 바랍니다.

VLM 기반 게임 에이전트 담당자음성 에이전트 담당자

업무내용

  • Game Auto Play Agent
    : 비전 기술 기반으로 다음 행동을 결정하고 제어
  • QA Agent
    : QA 자동화 에이전트
  • 게임 콘텐츠 분석
    : Multimodal AI 기술을 활용한 콘텐츠 분석
  • AI Agent 고도화
    : 성능개선을 위한 프롬프트, 플래닝,
      툴 사용, 자기 검증 체계 고도화


지원자격

  • AI Agent, 자연어 처리(NLP), Vision, Multimodal AI 등 
    분야에서 2년 이상의 연구 또는 서비스 개발 경험
    (관련 석/박사 연구 기간 포함)
  • Python 기반 모델 개발, 실험, 평가, 파이프라인 구현 경험
  • LLM/VLM을 활용한 APP 또는 Agent 설계/구현 경험
  • AI Coding Agent 활용 역량 보유
    (Claude code, codex 등)
  • 복잡한 문제를 논리적으로 정의하고 
    주도적으로 해결할 수 있는 역량 보유
  • 연구 결과를 실제 제품 또는 서비스 적용하는데
    관심과 경험 보유



우대사항

  • AI에이전트, 자연어처리, 음성AI 분야 석/박사 학위 보유자
  • VLM·멀티모달 모델의 파인튜닝, 평가, 추론 활용 경험
  • LLM/VLM 경량화 또는 가속화 경험
  • LLM/VLM 기반 서비스 또는 기능을 상용화한 경험
  • UI 기반 에이전트 또는 Computer Use Agent 개발 경험
    (예: GUI grounding, screen understanding, action planning 등)
  • Top-tier AI 학회* 논문 발표 또는 수상 경력
    NeurIPS, ICML, ICLR, CVPR, EMNLP, AAAI 등
  • 게임 도메인에 대한 이해 또는 관련 경험 보유
업무내용
  • 보이스AI 서비스 개발
    : Text-to-Speech (TTS), Voice Conversion,
      Voice Agent 등
  • AI 응용 기술 연구 및 상용화
    : 게임 개발, 운영 등 다양한 분야 적용 서비스




지원자격
  • 음성 분야에서 2년 이상의 연구 또는 서비스 개발 경험
    (관련 석/박사 연구 기간 포함)
  • 딥러닝 프레임워크로 모델 설계 및 학습하고,
    추론을 직접 수행한 경험 (PyTroch 등)
  • 딥러닝 및 신호처리, 음운론에 대한 이해 보유
    (Transformer, Diffusion, STFT, Prosody 등)
  • 다국어(Multi-lingual) / 다화자(Multi-speaker)
    TTS 모델 개발/고도화 경험
  • AI coding agent 활용 역량
    (claude code, codex 등)
  • 복잡한 문제를 논리적으로 정의하고,
    주도적으로 해결하는 역량 보유
  • 연구 결과를 실제 제품 또는 서비스 적용하는데
    관심과 경험 보유



우대사항
  • 음성AI, AI에이전트 분야 석/박사 학위 보유자
  • AI 관련 Top-tier 학회·저널*에 논문 발표 또는 수상 경력
    * ICASSP, Interspeech, NeurIPS, ICLR, ICML, TASLP 등
  • 오픈 소스 기여 이력
    (PyTorch, HuggingFace, ESPNet 등)
  • Flow Matching 및 Diffusion,
    LLM 기반 TTS 모델 연구 및 개발 경험
  • Nueral vocoder (BigVGAN, Vocos 등) /
    Nueral audio codec (Encodec, DAC 등) /
    Neural decompose-synthesis (DDSP, NANSY 등)
    구현 및 실험 경험
  • Emotion controllable 음성 합성 모델 개발/고도화 경험
  • 실시간(Streaming) 음성 합성 시스템 개발 및
    latency 최적화 경험
  • 게임 도메인 이해 또는 관련 경험

근무장소

  • - 서울시 구로구 디지털로 26길 38 G타워

© 2026 Pathsdog · 개인정보처리방침 · 이용약관 · 문의

채용공고 정보는 각 기업이 공개한 내용을 기반으로 합니다. 실제 지원 전 원문 공고를 반드시 확인하세요.