Have exp as Ai Engineer 2 years
Merancang dan membangun arsitektur microservices AI untuk OCR, LLM services, embedding service, dan pipeline RAG.
* Mengelola deployment sistem AI di Kubernetes (AWS EKS) dengan GPU node (A10G, T4, g5), Helm, dan Terraform.
* Mengonfigurasi dan memelihara infrastruktur MLOps termasuk IAM/IRSA, EBS/EFS CSI, serta monitoring dengan Grafana, Loki, dan DCGM Exporter.
* Melakukan optimasi performa inference menggunakan ONNX, TensorRT, OpenVINO, dan vLLM (batching, concurrency tuning, prefix cache).
* Menganalisis dan meningkatkan throughput, latency, penggunaan memori GPU, dan utilisasi KV cache pada layanan LLM dan OCR.
* Mendesain dan menjalankan load testing serta benchmarking layanan AI menggunakan Locust, k6, dan tool kustom.
* Menyusun laporan teknis hasil pengujian performa untuk stakeholder teknis dan manajemen.
* Mengembangkan dan memelihara sistem OCR berbasis microservices untuk pemrosesan dokumen skala besar.
* Membangun pipeline OCR modular yang mencakup deteksi dokumen, koreksi orientasi, deteksi teks, dan pengenalan teks.
* Mengelola konversi dan optimasi model OCR ke format inference (ONNX, TensorRT) untuk kebutuhan produksi.
* Mendesain dan mengimplementasikan API OCR dengan dukungan batching, concurrency, dan konfigurasi parameter dinamis.
* Mengoptimalkan pipeline preprocessing dan postprocessing gambar untuk meningkatkan akurasi dan stabilitas hasil OCR.
* Mengembangkan sistem Multimodal RAG dan VQA berbasis ColBERT/ColPali dan Vision-Language Models.
* Membangun sistem embedding dan retrieval untuk dokumen visual berbasis teks, layout, dan gambar.
* Mengembangkan dan memelihara stack layanan LLM (FastAPI, Redis, Kafka/SQS, object storage).
* Mendesain pipeline logging dan analytics terpisah untuk kebutuhan audit dan analisis performa.
* Melakukan eksperimen fine-tuning LoRA, quantization, dan distillation untuk efisiensi inference.
* Menginvestigasi isu determinisme CUDA, floating point drift, dan stabilitas numerik pada sistem produksi.
* Menulis dan memelihara dokumentasi teknis, SOP deployment, runbook operasional, dan laporan load testing.
Application Confirmation
You're applying for the role below: