Đâu là trợ lý giọng nói tiếng Việt phổ biến nhất trên ôtô?

Sau gần 4 năm ra mắt tại sự kiện Zalo AI Summit 2020, trợ lý giọng nói Kiki do các kỹ sư AI người Việt phát triển tiếp tục khẳng định điểm mạnh trong tính địa phương hóa.

Tính địa phương hóa hay khả năng thích nghi ngôn ngữ, văn hóa và thói quen bản địa là điểm khác biệt của trợ lý tiếng Việt Kiki Auto so với nhiều ứng dụng giọng nói khác trên thị trường.

Kiki Auto,  Kiki,  Zalo AI anh 1

“Cứ 5 ôtô thì có 1 xe dùng Kiki Auto”

Kiki Auto,  Kiki,  Zalo AI anh 2

Theo báo cáo “Thị trường trợ lý giọng nói toàn cầu giai đoạn 2023 - 2028”, mức tăng trưởng kép hay CAGR của lĩnh vực này là 27.3%

Báo cáo năm 2023 của Mordor Intelligence - công ty tư vấn và nghiên cứu xu hướng công nghệ toàn cầu, đã chỉ ra vai trò của tính địa phương hóa khi người dùng có xu hướng ưa chuộng ngôn ngữ khu vực của họ hơn tiếng Anh để giao tiếp hàng ngày. Báo cáo trên cũng đưa ra dự báo mức tăng trưởng kép của lĩnh vực này là 27.3%, tăng khoảng 9 lần quy mô ngành trong 10 năm tiếp theo.

Xu hướng trên cũng diễn ra với thị trường trợ lý giọng nói trên ôtô. Tại Việt Nam, trợ lý giọng nói Kiki đã có mặt trên gần 1 triệu ôtô. Với một thị trường có khoảng gần 5 triệu ôtô đang lưu hành trên cả nước (theo số liệu của cục Đăng kiểm Việt Nam), điều đó đồng nghĩa với việc cứ 5 ôtô thì có 1 xe đang dùng trợ lý giọng nói Kiki. Đây là một tỷ trọng trên khá lớn bởi trợ lý giọng nói thường được cài đặt trên các dòng xe từ 9 chỗ trở xuống, vốn chỉ chiếm khoảng 3 triệu phương tiện tại Việt Nam.

Việc trợ lý giọng nói được tích hợp sâu từ khi xuất xưởng chỉ mới phổ biến trên các dòng xe cao cấp, do đó thị phần trợ lý giọng nói trên xe mà Kiki Auto đang chiếm lĩnh là khá lớn.

Trợ lý giọng nói Kiki được thiết kế để phù hợp nhất cho người Việt

Một trong những vấn đề lớn nhất khi phát triển trợ lý giọng nói là làm sao để “bắt dính” được yêu cầu của người dùng. Việc nhiều trợ lý giọng nói được phát triển trên ngôn ngữ quốc tế hoặc khả năng hiểu tiếng Việt hạn chế sẽ ảnh hưởng đến quá trình ra lệnh bằng giọng nói, khó đáp ứng được yêu cầu của người dùng.

Với kinh nghiệm vận hành các sản phẩm và lợi thế “sân nhà”, đội ngũ kĩ sư AI người Việt tại Zalo lựa chọn phương án tối ưu sản phẩm dựa trên thói quen của người dùng. Vì thế, dù gọi sai tên của bài hát hay phát âm “ngọng” các địa danh, Kiki vẫn hiểu đúng để mở nhạc và chỉ đường chính xác.

Cho đến nay, trợ lý tiếng Việt Kiki là ứng dụng hiếm hoi có khả năng hiểu giọng nói địa phương. Sau gần 4 năm phát triển, trợ lý Kiki có thể nhanh chóng “hiểu” câu lệnh giọng nói của hơn 60 ngữ điệu khác nhau của người sử dụng đến từ khắp các tỉnh thành, đáp ứng đúng nhu cầu người dùng Việt.

Kiki Auto,  Kiki,  Zalo AI anh 3

Trợ lý Kiki có thể mở cùng lúc nhiều tác vụ bằng câu lệnh giọng nói, giảm thiểu các xao nhãng khi lái xe

Để tối ưu khả năng hiểu dữ liệu đầu vào cho Kiki, đội ngũ kỹ sư phải giả lập ứng dụng trong nhiều môi trường với đa dạng mức độ tạp âm. Bên cạnh đó, trợ lý Kiki có thể hoạt động tốt trong nhiều khu vực di chuyển như cao tốc, khu đông dân cư… với lượng tiếng ồn lớn do lốp xe hay tiếng còi từ phương tiện giao thông.

Nhận diện được câu lệnh trong nhiều môi trường âm thanh không phải vấn đề đơn giản, đáp ứng đúng yêu cầu người dùng lại càng phức tạp hơn. Muốn làm được điều này, mô hình trí tuệ nhân tạo phải đủ mạnh để phát hiện chính xác vấn đề. Để trợ lý giọng nói Kiki trở nên thông minh hơn, đội ngũ kỹ sư đã phải dành hàng nghìn giờ huấn luyện mô hình AI, cung cấp đa dạng nguồn thông tin, bên cạnh việc phải giải quyết sự hạn chế dữ liệu tiếng Việt - vốn là rào cản khiến nhiều mô hình AI khó có thể “học” và nhận diện được chính xác câu lệnh.

Kiki Auto,  Kiki,  Zalo AI anh 4

Tính năng “Cảnh báo tốc độ” ra mắt trong thời gian gần đây nhận được nhiều quan tâm từ người dùng. Ảnh: Youtube Tuệ Minh.

Một yếu tố tạo nên sự khác biệt của trợ lý giọng nói Kiki là khả năng gửi thông tin trong điều kiện đường truyền kém. Các quốc gia phát triển thường có hạ tầng kết nối mạng ổn định. Chính vì vậy, nhiều sản phẩm công nghệ thường được thiết kế phù hợp với nền tảng hạ tầng tốt trong khi gặp khó khăn trong việc thích ứng với những điều kiện hạ tầng kém ổn định. Điều này dẫn đến việc người dùng ở khu vực có internet không ổn định gặp khó khăn trong việc thực hiện các truy vấn trên nhiều ứng dụng công nghệ, trong đó có trợ lý giọng nói.

Trong khi đó, cách đây hơn 10 năm, người dùng Zalo đã có thể gửi đi các đoạn ghi âm mà không gặp các vấn đề đường truyền. Áp dụng kinh nghiệm nén audio để gửi đi trong điều kiện mạng yếu từ Zalo, trợ lý giọng nói Kiki không gặp nhiều khó khăn để truy vấn thông tin tức thì, tối ưu nhu cầu điều khiển bằng giọng nói trong khi đang lái xe. Đây cũng là điểm khác biệt khiến Kiki phổ biến trên các tỉnh thành tại Việt Nam.

Kiki Auto,  Kiki,  Zalo AI anh 5

Với những cải tiến đáng kể của Kiki Auto, người dùng có thể mở nhanh các tác vụ trên ôtô bằng câu lệnh giọng nói mà không cần chạm vào màn hình, giúp duy trì tập trung, giảm thiểu các tai nạn khi lái xe. Ngoài ra, Kiki còn sở hữu các tính năng nổi bật như nghe nhạc, chỉ đường hay kiểm tra phạt nguội bằng giọng nói.

Mới đây đội ngũ Kiki Auto đã thử nghiệm thành công các tính năng mới của Kiki Auto trên mẫu xe điện BYD Atto 3. Theo đó, sau khi tích hợp sâu người dùng có thể ra lệnh xoay màn hình, mở nhiều tác vụ cùng lúc hay gọi trợ lý giọng nói bằng câu lệnh “Kiki ơi!”.

Thử nghiệm trên hứa hẹn nhiều tính năng mới sẽ được ra mắt trong thời gian tới, nhằm mang trợ lý Kiki vào cuộc sống người Việt với nhiều vai trò hữu ích.