AI Engineer

Have exp as Ai Engineer 2 years

Merancang dan membangun arsitektur microservices AI untuk OCR, LLM services, embedding service, dan pipeline RAG.

* Mengelola deployment sistem AI di Kubernetes (AWS EKS) dengan GPU node (A10G, T4, g5), Helm, dan Terraform.

* Mengonfigurasi dan memelihara infrastruktur MLOps termasuk IAM/IRSA, EBS/EFS CSI, serta monitoring dengan Grafana, Loki, dan DCGM Exporter.

* Melakukan optimasi performa inference menggunakan ONNX, TensorRT, OpenVINO, dan vLLM (batching, concurrency tuning, prefix cache).

* Menganalisis dan meningkatkan throughput, latency, penggunaan memori GPU, dan utilisasi KV cache pada layanan LLM dan OCR.

* Mendesain dan menjalankan load testing serta benchmarking layanan AI menggunakan Locust, k6, dan tool kustom.

* Menyusun laporan teknis hasil pengujian performa untuk stakeholder teknis dan manajemen.

* Mengembangkan dan memelihara sistem OCR berbasis microservices untuk pemrosesan dokumen skala besar.

* Membangun pipeline OCR modular yang mencakup deteksi dokumen, koreksi orientasi, deteksi teks, dan pengenalan teks.

* Mengelola konversi dan optimasi model OCR ke format inference (ONNX, TensorRT) untuk kebutuhan produksi.

* Mendesain dan mengimplementasikan API OCR dengan dukungan batching, concurrency, dan konfigurasi parameter dinamis.

* Mengoptimalkan pipeline preprocessing dan postprocessing gambar untuk meningkatkan akurasi dan stabilitas hasil OCR.

* Mengembangkan sistem Multimodal RAG dan VQA berbasis ColBERT/ColPali dan Vision-Language Models.

* Membangun sistem embedding dan retrieval untuk dokumen visual berbasis teks, layout, dan gambar.

* Mengembangkan dan memelihara stack layanan LLM (FastAPI, Redis, Kafka/SQS, object storage).

* Mendesain pipeline logging dan analytics terpisah untuk kebutuhan audit dan analisis performa.

* Melakukan eksperimen fine-tuning LoRA, quantization, dan distillation untuk efisiensi inference.

* Menginvestigasi isu determinisme CUDA, floating point drift, dan stabilitas numerik pada sistem produksi.

* Menulis dan memelihara dokumentasi teknis, SOP deployment, runbook operasional, dan laporan load testing.

Application Confirmation

You're applying for the role below:

AI Engineer

Location: Kota Administrasi Jakarta Selatan

Contract Details: Contract

Submit Date: 2026-01-13

No CV uploaded

About the job

Location Kota Administrasi Jakarta Selatan
Created On 2026-01-13
Working Model WFO
Job Level Middle