Mô Tả Công Việc
@import url('https://fonts.googleapis.com/css2?family=Poppins:ital,wght@0,100;0,300;0,400;0,500;0,700;0,900;1,100;1,300;1,400;1,500;1,700;1,900&display=swap');
.template__td {
font-family: 'Poppins', sans-serif;
}
.svg-color path {
fill: #223F99
}
SALARY
Negotiable
Chúng tôi đang tìm kiếm một AI/ML Developer để tham gia phát triển dự án RAG (Retrieval-Augmented Generation) sử dụng dữ liệu genome từ file VCF (.vcf.gz, .vcf.gz.tbi) và triển khai trên AWS. Bạn sẽ chịu trách nhiệm xây dựng pipeline xử lý dữ liệu, tạo vector store, và tích hợp mô hình ngôn ngữ lớn (LLM) để hỗ trợ truy vấn tự nhiên, góp phần tạo ra giải pháp AI tiên tiến.
RESPONSIBILITIES
Xử lý và phân tích file VCF (.vcf.gz, .vcf.gz.tbi) bằng pysam hoặc cyvcf2, chuẩn hóa dữ liệu với VEP hoặc ANNOVAR.
Tạo embedding và quản lý vector store (FAISS, Pinecone, hoặc Weaviate) cho dữ liệu genome.
Tích hợp và tối ưu hóa pipeline RAG với LangChain hoặc LlamaIndex cùng LLM (OpenAI GPT, LLaMA3, hoặc Mistral).
Hỗ trợ triển khai và kiểm thử trên AWS (S3, Lambda).
REQUIREMENTS
Tối thiểu 2-3 năm kinh nghiệm trong AI/ML, ưu tiên với dự án RAG hoặc xử lý dữ liệu genome.
Thành thạo Python, có kinh nghiệm với VCF file và các công cụ như pysam, cyvcf2.Thành thạo Python, có kinh nghiệm với VCF file và các công cụ như pysam, cyvcf2.Thành thạo Python, có kinh nghiệm với VCF file và các công cụ như pysam, cyvcf2.Thành thạo Python, có kinh nghiệm với VCF file và các công cụ như pysam, cyvcf2.Thành thạo Python, có kinh nghiệm với VCF file và các công cụ như pysam, cyvcf2.Thành thạo Python, có kinh nghiệm với VCF file và các công cụ như pysam, cyvcf2.Thành thạo Python, có kinh nghiệm với VCF file và các công cụ như pysam, cyvcf2.Thành thạo Python, có kinh nghiệm với VCF file và các công cụ như pysam, cyvcf2.
Hiểu biết về vector database (FAISS, Pinecone) và mô hình ngôn ngữ lớn (LLM).
Kiến thức cơ bản về AWS (S3, Lambda) là một lợi thế.
Ưu tiên ứng viên có kinh nghiệm với LangChain, LlamaIndex, hoặc các thư viện embedding (sentence-transformers).
Chúng tôi đang tìm kiếm một AI/ML Developer để tham gia phát triển dự án RAG (Retrieval-Augmented Generation) sử dụng dữ liệu genome từ file VCF (.vcf.gz, .vcf.gz.tbi) và triển khai trên AWS. Bạn sẽ chịu trách nhiệm xây dựng pipeline xử lý dữ liệu, tạo vector store, và tích hợp mô hình ngôn ngữ lớn (LLM) để hỗ trợ truy vấn tự nhiên, góp phần tạo ra giải pháp AI tiên tiến.
BENEFIT
Lương cao thỏa thuận theo năng lực và tinh thần làm việc
Review lương 1-2 lần/ 1 năm
Thưởng tết, quà sinh nhật, cafe, đồ ăn, trang thiết bị làm việc đầy đủ
BHXH và phép năm theo luật lao động
Môi trường thân thiện, hòa đồng
Thời gian làm việc: T2-T6: 09:00 ~ 18:00
Địa chỉ: Căn B1 D 'Verano, Đường N6, Khu dân cư Thủ Thiêm Lakeview, Phường An Khánh, Thành phố Hồ Chí Minh, Việt Nam
Xem toàn bộ Mô Tả Công Việc
Hình thức
Full-time
Mức lương
Thỏa thuận
Báo cáo tin tuyển dụng: Nếu bạn thấy rằng tin tuyển dụng này không đúng hoặc có dấu hiệu lừa đảo,
hãy phản ánh với chúng tôi.
Tham khảo: 10 Dấu hiệu nhận biết hành vi lừa đảo qua tin tuyển dụng.
Tham khảo: 10 Dấu hiệu nhận biết hành vi lừa đảo qua tin tuyển dụng.