Large Language Model inference optimization engineer

42dot

  • 서울시 강남구
  • 정규직
  • 풀타임
  • 1개월 전
  • 쉽게 지원하기
42dot LLM inference optimization engineer는 42dot에서 자체적으로 만든 생성형 초거대 언어 모델인 42dot LLM 추론 속도를 최적화하여 서버 뿐만 아니라 임베디드 환경에서도 실서비스 가능한 수준의 초거대 언어 모델 개발을 하는 것을 목표로 합니다.책임 (Responsibilities)
  • 초거대 언어 모델 (LLM)의 추론 속도 최적화에 관한 연구 및 개발
  • 서버 및 임베디드 (On-Device) 환경에서 LLM 모듈의 성능 최적화
  • Open-source inference backend solution 성능비교 및 최적화 방안 수립
  • Quantize 기법의 성능비교 및 환경별 최적화 방안 수립
자격요건 (Qualifications)
  • 3년 이상의 관련 분야에서의 경력 또는 석사 졸업 예정자
  • 서버 또는 On-Device LLM 프레임워크 개발 경험
  • 최신 기계 학습 및 인공 지능 기술에 대한 폭넓은 이해와 알고리즘 구현/평가 능력
  • Python, C, C++, Rust 중 1개 이상 프로그래밍 언어의 능숙한 사용 가능
우대사항 (Preferred Qualifications)
  • LLM을 활용한 실시간 서비스 개발 경험
  • GPU inference service 구축 경험
  • Cuda fused kernel 분석 또는 개발 경험
  • NPU 분석 및 최적화 코드 개발 경험
  • 기계 학습, 인공 지능, 데이터 분석, 추천 분야 상위급 저널 또는 학회 논문 저자
전형절차 (Interview Process)
  • 서류전형 - 코딩테스트 - 화상면접 (1시간 내외) - 대면 혹은 화상면접 (3시간 내외) - 최종합격
  • 전형절차는 직무별로 다르게 운영될 수 있으며, 일정 및 상황에 따라 변동될 수 있습니다.
  • 전형일정 및 결과는 지원서에 등록하신 이메일로 개별 안내드립니다.
참고사항 (Additional Information)
  • 이력서 제출 시 주민등록번호, 가족관계, 혼인 여부, 연봉, 사진, 신체조건, 출신 지역 등 채용절차법상 요구 금지된 정보는 제외 부탁드립니다.
  • 모든 제출 파일은 30MB 이하의 PDF 양식으로 업로드를 부탁드립니다. (이력서 업로드 중 문제가 발생한다면 이력서와 함께 지원하시고자 하는 포지션의 URL을 recruit@42dot.ai으로 전송 부탁드립니다.)
  • 인터뷰 프로세스 종료 후 지원자의 동의하에 평판조회가 진행될 수 있습니다.
  • 국가보훈대상자 및 취업보호 대상자는 관계법령에 따라 우대합니다.
  • 장애인 고용 촉진 및 직업재활법에 따라 장애인 등록증 소지자를 우대합니다.
  • 42dot은 의뢰하지 않은 서치펌의 이력서를 받지 않으며, 요청하지 않은 이력서에 대해 수수료를 지불하지 않습니다.
※ 지원 전 아래 내용을 꼭 확인해 주세요.ㆍ42dot이 일하는 방식,ㆍ42dot만의 직원 몰입을 돕는 업무몰입 프로그램,

42dot

비슷한 채용공고

  • Frontend Engineer

    42dot

    • 서울시 강남구
    42dot의 Map & Navigation 팀은 안전하고 편안한 모빌리티 서비스를 제공하기 위해 SD 및 HD 지도 사양을 정의하고 이를 이용한…
    • 1개월 전
    • 쉽게 지원하기
  • 3D Vision Engineer

    42dot

    • 서울시 강남구
    42dot의 3D Vision Engineer 는 안전한 자율주행 기술과 HD 지도 제작 자동화/업데이트 기술들을 연구 개발합니다. 고도화된 컴…
    • 1개월 전
    • 쉽게 지원하기