Theo đó, để bật, tắt đèn, TV bằng hệ thống giao tiếp, người dùng chỉ vào vật trong ba giây; để chuyển kênh truyền hình, người dùng chỉ ngón tay lên hoặc xuống.
Khang cho biết bạn đã sử dụng nền tảng OpenCV3, Caffe Deep learning và MSCOCO Model để tạo ra một server chính có khả năng nhận biết khung xương con người trên ảnh chụp, hiểu các hướng chỉ tay.
Trong đó, OpenCV là một mã nguồn mở đọc hình ảnh từ camera và truyền ảnh sang Caffe cũng như hiển thị khung xương lên màn hình. Caffe Deep learning là một phần mềm xây dựng mạng neuron nhân tạo - cơ sở cho Trí tuệ nhân tạo (AI). MSCOCO là mã nguồn chứa dữ liệu dành cho AI có thể học được, ở đây Khang sử dụng phương pháp Keypoint model (đánh dấu) để máy tính học khung xương con người.
Để điều khiển TV, Khang đặt đèn hồng ngoại trước mắt nhận của TV còn rơle kết nối với Arduino có nhiệm vụ bật/tắt. Arduino giao tiếp với chip Intel qua wifi từ đó truyền dữ liệu về server. Tận dụng server của Amazon và GPU có sẵn trên laptop, Khang tạo môi trường cho máy tính học dữ liệu (cử động khung xương người dùng).
Khi chỉ tay vào thiết bị điện, camera ghi nhận hình ảnh lưu về chip Intel, truyền về server chính. Server chính sẽ có nhiệm vụ tìm khung xương (vị trí cánh tay) và trả dữ liệu về chip Intel để tính toán phương cánh tay đến vật đã chỉ có gần hay trùng nhau hay không. Nếu trùng thì sẽ gửi thông tin bật/tắt vật qua Arduino điểu chỉnh trạng thái rơle để đóng ngắt dòng điện.
Được biết, hệ thống độc đáo này có tên là HoverRoom, thuộc lĩnh vực trí tuệ nhân tạo (AI) đã gây ấn tượng mạnh với ban giám khảo và đạt giải nhì tại cuộc thi Young Makers Challenge 2017…
Bình luận