Công nghệ mới có thể đơn giản hóa bắt chước trong chế tạo người máy

Trong vài thập kỷ qua, các nhà khoa học máy tính đã cố gắng đào tạo robot để có thể giải quyết nhiều nhiệm vụ khác nhau, bao gồm đảm nhiệm việc nhà và quy trình sản xuất. Một trong những chiến lược nổi tiếng nhất được sử dụng để huấn luyện robot làm các công việc thủ công là học bắt chước (imitation learning).

Hình ảnh thể hiện hai ‘nửa’ phương pháp của các nhà nghiên cứu, học biểu hiện ở hình bên trái, bắt chước hành vi thông qua thuật toán láng giềng gần nhất ở bên phải. Nguồn: Pari và cộng sự.

Đúng như tên gọi của nó, học bắt chước đòi hỏi phải dạy cho robot cách làm điều gì đó dựa trên các trình diễn của con người. Mặc dù trong một số nghiên cứu, chiến lược đào tạo này đã đạt được những kết quả rất hứa hẹn nhưng đòi hỏi phải có tập dữ liệu lớn và chú thích chứa trong đó hàng trăm video các biểu hiện con người hoàn thành một nhiệm vụ nhất định.

Gần đây, các nhà nghiên cứu tại Trường Đại học New York đã phát triển được công nghệ VINN, một khung học bắt chước thay thế mà không nhất thiết phải có bộ dữ liệu đào tạo lớn. Phương pháp tiếp cận mới này, được công bố trên tạp chí arXiv, hoạt động bằng cách tách biệt hai khía cạnh khác nhau của học bắt chước, đó là học biểu hiện trực quan của một nhiệm vụ và các hành động liên quan.

Trên TechXplore, Jyo Pari, thành viên nhóm thực hiện nghiên cứu, cho biết: “Học bắt chước yêu cầu hai thành phần cơ bản: một là, học những gì có liên quan trong ngữ cảnh thực tế diễn ra; và hai là, sử dụng các tính năng liên quan như thế nào để thực hiện nhiệm vụ theo yêu cầu. Nhóm nghiên cứu muốn tách biệt các thành phần này (nó thường được ghép thành một hệ thống) và biết rõ vai trò và tầm quan trọng của mỗi thành phần”.

Hầu hết các phương pháp học bắt chước hiện có đều kết hợp biểu hiện và học hành vi thành một hệ thống duy nhất. Kỹ thuật mới do Pari và các đồng nghiệp của ông tạo ra tập trung vào việc học biểu hiện, quá trình mà các tác nhân AI và robot học cách xác định các tính năng liên quan đến nhiệm vụ trong một ngữ cảnh.

“Chúng tôi sử dụng các phương pháp hiện có trong học biểu hiện tự giám sát, một lĩnh vực phổ biến trong cộng đồng thị giác. Các phương pháp này có thể đưa ra một bộ sưu tập các hình ảnh không có nhãn và trích xuất các đặc điểm có liên quan. Việc áp dụng phương pháp này giúp robot bắt chước sẽ đạt hiệu quả vì có thể giúp nó xác định hình ảnh nào trong tập dữ liệu có biểu hiện giống nhất để robot có thể tìm kiếm các biểu hiện của láng giềng gần nhất một cách đơn giản. Do đó, chúng tôi chỉ cần làm cho rô-bốt sao chép các hành động từ các hình ảnh biểu hiện tương tự”, Pari giải thích.

Sử dụng chiến lược học bắt chước mới mà họ đã phát triển, Pari và các đồng nghiệp của ông có thể tăng hiệu suất của các mô hình bắt chước trực quan trong môi trường mô phỏng. Họ cũng đã thử nghiệm cách tiếp cận này trên một robot thật, dạy nó cách mở cửa một cách hiệu quả khi cho đưa các hình ảnh trình diễn tương tự.

“Tôi cảm thấy nghiên cứu của chúng tôi có thể là nền tảng cho các tác phẩm sử dụng phương pháp học biểu hiện để nâng cao các mô hình học bắt chước trong tương lai. Tuy nhiên, ngay cả khi các phương pháp này có thể thực hiện một nhiệm vụ đơn giản thông qua thuật toán gần nhất, chúng vẫn có tồn tại một số nhược điểm”, Pari nói.

Trong tương lai, khuôn khổ mới có thể giúp đơn giản hóa các quy trình học bắt chước trong robot, tạo điều kiện thuận lợi cho việc triển khai quy mô lớn. Cho đến nay, Pari và các đồng nghiệp của ông mới chỉ sử dụng chiến lược của họ để huấn luyện robot trong các nhiệm vụ đơn giản. Trong các nghiên cứu tiếp theo, họ có kế hoạch khám phá các chiến lược khả thi cho phép họ thực hiện nó trên các nhiệm vụ phức tạp hơn.

“Chúng tôi hiện đang nỗ lực mở rộng VINN để có thể thực hiện không chỉ một nhiệm vụ mà còn nhiều nhiệm vụ khác nhau”, Pari nói thêm.

P.T.T (NASATI), theo https://techxplore.com/news/2022-01-framework-imitation-robotics.html, 17/1/2022