Mô Tả Công Việc
Nghiên cứu và phát triển các thuật toán Xử lý tiếng nói: xoá/lọc nhiễu, nhận dạng tiếng nói, tổng hợp tiếng nói, voice cloning, nhận diện người nói, tách tiếng (Speaker Diarization), dịch trực tiếp tiếng nói cho tiếng Nhật, Anh, Việt, Hàn.
Xây dựng mô hình âm học (acoustic model), mô hình ngôn ngữ (language model), decoder, tối ưu hoá từ điển, ...
Nghiên cứu và phát triển các mô hình Nhận dạng tiếng nói dựa trên neural networks.
Nghiên cứu và xây dựng các bộ cơ sở dữ liệu huấn luyện từ vựng lớn đảm bảo độ phủ về chất giọng vùng miền, độ tuổi, giới tính, môi trường... phù hợp với từng bài toán cụ thể.
Nghiên cứu và phát triển các mô hình học máy cho Tổng hợp tiếng nói, voice clone,voice converter... dựa trên các mô hình như HMM, DNN, Transformers.
Xem toàn bộ Mô Tả Công Việc
Yêu Cầu Công Việc
Nắm được các kiến thức cơ bản về Xử lý tín hiệu số, cơ sở Toán học cho Xử lý tín hiệu số (Fast Fourier Transform, spectrogram, trích chọn đặc trưng tín hiệu, sử dụng bộ lọc tín hiệu,...)
Nắm được các kiến thức cơ bản về xây dựng các mô hình Nhận diện/ Tổng hợp tiếng nói (acoustic model, language model, feature bank,...)
Có kiến thức cơ bản về học máy, nắm được các mô hình cơ bản thường dùng trong Xử lý tiếng nói: HMM, DNN, DTW.
Có kiến thức cơ bản về học máy với mô hình mạng nơ-ron (neural networks), các mô hình seq2seq,…
Có kinh nghiệm làm việc với các Deep Learning frameworks như Pytorch hay Tensorflow.
Có kinh nghiệm sử dụng các framework/toolkits cho Nhận diện và Tổng hợp tiếng nói như: Kaldi, Tacotron, FastSpeech, Whisper,...
Lập trình hướng đối tượng thành thạo với một trong các ngôn ngữ sau : C++/C, Python, Java.
Tiếng Anh tốt là một lợi thế.
Xem toàn bộ Yêu Cầu Công Việc
Hình thức
Full-time
Mức lương
Thỏa thuận
Báo cáo tin tuyển dụng: Nếu bạn thấy rằng tin tuyển dụng này không đúng hoặc có dấu hiệu lừa đảo,
hãy phản ánh với chúng tôi.
Tham khảo: 10 Dấu hiệu nhận biết hành vi lừa đảo qua tin tuyển dụng.
Tham khảo: 10 Dấu hiệu nhận biết hành vi lừa đảo qua tin tuyển dụng.