Đừng cố SPAM, sẽ cấm vĩnh viễn ngay và luôn

Hồ Chí Minh Cộng đồng AI tiếp cận công nghệ định danh giọng nói bằng tiếng Việt

nguyenthuhang88

Thành viên cấp 1
Tham gia
17/11/19
Bài viết
1,128
Thích
1
Điểm
38
#1
Trong cuộc thi “Zalo AI Challenge 2020”, các đội thi phải giải bài toán mới và có tính bản địa cao thông qua bảng đấu Voice Verification - xác thực danh tính bằng giọng nói tiếng Việt. Ở bảng này, các đội xây dựng mô hình máy học nhằm rút trích đặc trưng trong giọng nói người Việt, từ đó so sánh hai câu nói nhằm xác thực danh tính người nói.


Đến với cuộc thi, các đội chơi được cung cấp bộ dữ liệu gồm hơn 10.000 câu nói tiếng Việt của hơn 500 người Việt được trích xuất từ các video phỏng vấn. Đây là nguồn dữ liệu giúp các đội huấn luyện các mô hình máy học nhằm phân biệt được giọng nói của hai người. Ngoài bộ dữ liệu cung cấp sẵn, các đội thi được khuyến khích tận dụng nguồn dữ liệu bên ngoài để gia tăng độ chính xác cho mô hình huấn luyện.

Tiến sĩ Nguyễn Tiến Huy, thành viên Zalo AI Lab, đồng thời là cố vấn cuộc thi, cho biết: “Sau 1 tuần mở cổng đăng ký, bảng đấu Voice Verification thu hút hơn 120 đội thi. Hiện tại, kết quả của các đội dẫn đầu rất sát sao với điểm chênh lệch 0,1%. Bảng xếp hạng cũng biến động từng ngày, các nhân tố bứt phá xuất hiện mỗi ngày, khiến cuộc đua trở nên thú vị hơn”.

Dân công nghệ vốn quen với nhiều hình thức định danh khác nhau, từ mật khẩu, vân tay, khuôn mặt đến mống mắt. Trong thời gian tới, người Việt sẽ có thể xác thực nhanh chóng thông qua giọng nói bằng tiếng mẹ đẻ.

Bảng thi Voice Verification mang ý nghĩa mấu chốt với cộng đồng AI Việt Nam và được kỳ vọng là tiền đề giúp kỹ sư AI Việt tiếp cận và phát triển thêm nhiều ứng dụng từ công nghệ này.

Cuộc thi “Zalo AI Challenge 2020” giúp cộng đồng kỹ sư tiếp cận lời giải bài toán định danh bằng giọng nói tiếng Việt.

Voice Verification (định danh bằng giọng nói) là quá trình xác minh hai câu nói có thuộc cùng cá nhân hay không, từ đó, cho phép máy định danh người nói và cá nhân hóa trải nghiệm người dùng trong các tác vụ tiếp theo.

Trên thế giới, định danh bằng giọng nói không còn xa lạ với người dùng. Trong các lĩnh vực như an ninh, ngân hàng, công nghệ này là phương pháp nhận diện sinh trắc học bên cạnh nhận diện khuôn mặt, vân tay hay mống mắt. Dùng giọng nói để xác minh danh tính tại ngân hàng, thực hiện các tác vụ bảo mật trên điện thoại hoặc các thiết bị thông minh là những ứng dụng phổ biến của công nghệ này.

Với sự phát triển của các mô hình học sâu (deep learning) và nguồn dữ liệu phong phú, công nghệ xác thực giọng nói trong tiếng Anh có độ chuẩn xác cao. Tuy nhiên, với cộng đồng công nghệ Việt Nam, bài toán xác định danh tính bằng giọng nói tiếng Việt vẫn còn ở giai đoạn sơ khai, chưa có cách tiếp cận tối ưu với sự đa dạng của phương ngữ.
sửa máy tính tận nơi quận nhà bè

sửa máy tính tận nơi quận nhà bè
 

Đối tác

Top