Large Language Model inference optimization engineer
42dot
- 서울시 강남구
- 정규직
- 풀타임
- 초거대 언어 모델 (LLM)의 추론 속도 최적화에 관한 연구 및 개발
- 서버 및 임베디드 (On-Device) 환경에서 LLM 모듈의 성능 최적화
- Open-source inference backend solution 성능비교 및 최적화 방안 수립
- Quantize 기법의 성능비교 및 환경별 최적화 방안 수립
- 3년 이상의 관련 분야에서의 경력 또는 석사 졸업 예정자
- 서버 또는 On-Device LLM 프레임워크 개발 경험
- 최신 기계 학습 및 인공 지능 기술에 대한 폭넓은 이해와 알고리즘 구현/평가 능력
- Python, C, C++, Rust 중 1개 이상 프로그래밍 언어의 능숙한 사용 가능
- LLM을 활용한 실시간 서비스 개발 경험
- GPU inference service 구축 경험
- Cuda fused kernel 분석 또는 개발 경험
- NPU 분석 및 최적화 코드 개발 경험
- 기계 학습, 인공 지능, 데이터 분석, 추천 분야 상위급 저널 또는 학회 논문 저자
- 서류전형 - 코딩테스트 - 화상면접 (1시간 내외) - 대면 혹은 화상면접 (3시간 내외) - 최종합격
- 전형절차는 직무별로 다르게 운영될 수 있으며, 일정 및 상황에 따라 변동될 수 있습니다.
- 전형일정 및 결과는 지원서에 등록하신 이메일로 개별 안내드립니다.
- 이력서 제출 시 주민등록번호, 가족관계, 혼인 여부, 연봉, 사진, 신체조건, 출신 지역 등 채용절차법상 요구 금지된 정보는 제외 부탁드립니다.
- 모든 제출 파일은 30MB 이하의 PDF 양식으로 업로드를 부탁드립니다. (이력서 업로드 중 문제가 발생한다면 이력서와 함께 지원하시고자 하는 포지션의 URL을 recruit@42dot.ai으로 전송 부탁드립니다.)
- 인터뷰 프로세스 종료 후 지원자의 동의하에 평판조회가 진행될 수 있습니다.
- 국가보훈대상자 및 취업보호 대상자는 관계법령에 따라 우대합니다.
- 장애인 고용 촉진 및 직업재활법에 따라 장애인 등록증 소지자를 우대합니다.
- 42dot은 의뢰하지 않은 서치펌의 이력서를 받지 않으며, 요청하지 않은 이력서에 대해 수수료를 지불하지 않습니다.