Ứng dụng

Tìm kiếm địa điểm bằng giọng nói tiếng Việt trên iPhone

Tìm kiếm địa điểm bằng giọng nói tiếng Việt trên iPhone

Ứng dụng iSago dùng công nghệ nhận dạng và tổng hợp tiếng nói tiếng Việt giúp người dùng tương tác với điện thoại iPhone để tìm thông tin về ẩm thực, giải trí tại TP HCM.

 

iSago là thành quả nghiên cứu trong 3 năm của phòng thí nghiệm AILab thuộc Đại học Khoa học Tự nhiên TP HCM. Ở phiên bản 1.0, iSago cung cấp chức năng tìm kiếm thông tin nhà hàng, quán bar, cafe, địa điểm giải trí trên địa bàn TP.HCM.

< designtimesp="6865">Clip tìm thông tin bằng iSago</>

Giao diện ứng dụng iSago trên điện thoại iPhone. Ảnh: Hà Mai.

Sau khi cài iSago vào iPhone, người dùng có thể đặt câu hỏi bằng giọng nói như “Tôi muốn tìm quán cafe ở quận 1” hay “Tôi muốn ăn phở tại quận 1”... iSago sẽ truyền nội dung truy vấn này về server để xử lý và gửi lại kết quả tìm kiếm.

Quy trình hoạt động tìm kiếm thông tin bằng giọng nói của ứng dụng iSago.

Kết quả là một danh sách tên nhà hàng, địa chỉ. Khi nhấn vào danh sách thì địa điểm cần tìm sẽ được hiển thị trên bản đồ hoặc người dùng có thể nghe đọc địa chỉ trực tiếp bằng công nghệ tổng hợp giọng nói. Trong trường hợp không có kết nối mạng, người dùng vẫn có thể tìm kiếm trên điện thoại iPhone bằng những câu truy vấn văn bản nhập vào từ bàn phím.

Quy trình hoạt động hệ thống VIS (Viet voIce System).

Phòng thí nghiệm AILab cũng giới thiệu hệ thống VIS (Viet voIce System) hỗ trợ hỏi đáp thông tin bằng tiếng Việt qua đường điện thoại, sử dụng công nghệ nhận dạng và tổng hợp tiếng nói tiếng Việt với độ chính xác cao và tốc độ xử lý nhanh.

Khi có người gọi điện đến, hệ thống sẽ phân tích giọng nói để chuyển máy đến người cần gặp. Ảnh: Hà Mai.

VIS phiên bản đầu tiên bao gồm một số dịch vụ trong đó nổi bật nhất là dịch vụ tự động chuyển cuộc gọi VIS:DIR. Với VIS:DIR người dùng có thể nói tên các phòng, ban trong một trường đại học sau đó hệ thống sẽ tự động chuyển cuộc gọi đến các phòng, ban tương ứng mà không phải tìm kiếm số điện thoại trong danh bạ hoặc chờ đợi tiếp tân nối máy.

< designtimesp="6905">Clip hệ thống VIS:DIR nhận dạng giọng nói</>