Nghiên cứu, đánh giá và cập nhật liên tục các xu hướng, mô hình và kỹ thuật mới nhất trong lĩnh vực Natural Language Processing (NLP), Computer Vision (CV) và Generative AI, phục vụ các sản phẩm chuyển đổi số và hệ thống AI nội bộ.
Thiết kế, phát triển và tối ưu hóa các Large Language Model (LLMs) và Multimodal Large Language Models (MLLMs) cho nhiều bài toán thực tế, bao gồm nhưng không giới hạn:
Retrieval-Augmented Generation (RAG)
Chatbot/Virtual Assistant
Document Understanding, Information Extraction
Text Classification, Summarization, Question Answering
Xây dựng và tối ưu pipeline fine-tuning, instruction-tuning, preference tuning cho LLMs (SFT, LoRA/QLoRA, PEFT, RL).
Làm việc với các mô hình mã nguồn mở và thương mại như LLaMA, DeepSeek, Qwen, Mistral, kết hợp với Vector Database để xây dựng hệ thống tìm kiếm ngữ nghĩa và RAG ở quy mô lớn.
Thiết kế và tối ưu embedding pipelines, vector indexing, retrieval strategy (hybrid search, reranking).
Đánh giá, phân tích và cải thiện hiệu suất mô hình theo các tiêu chí:
Accuracy, latency, throughput, memory footprint
Hallucination, factuality, robustness
Phối hợp với các nhóm Backend, Data, DevOps để:
Tích hợp mô hình AI vào hệ thống sản phẩm
Triển khai mô hình ở môi trường production (on-premise hoặc cloud)
Thực hiện tài liệu hóa kỹ thuật, báo cáo nghiên cứu và báo cáo tiến độ theo yêu cầu của ban quản lý.
Phát triển và triển khai các hệ thống Speech AI, bao gồm:
Automatic Speech Recognition (ASR) với Whisper, WhisperX, Wav2Vec2
Alignment, diarization và hậu xử lý dữ liệu âm thanh