Danh sách bài viết

Trí thông minh nhân tạo tiên đoán được "bạn sẽ làm gì"

Cập nhật: 08/09/2022

Đây là mã mới giúp máy tính lần đầu quan sát được từng chuyển động nhỏ của nhiều người cùng một lúc và có khả năng khiến robot hiểu ngôn ngữ không lời.

Trong khi con người giao tiếp tự nhiên bằng cách sử dụng ngôn ngữ cơ thể, các máy tính "ít hoặc nhiều bị mù" trước những tương tác này. Nhưng mã mới có thể cải thiện khả năng của robot trong các tình huống xã hội khi hiểu được cơ thể và cử động của người.

Lần đầu tiên robot có khả năng quan sát và thấy chuyển động bàn tay rõ đến như vậy
Lần đầu tiên robot có khả năng quan sát và thấy chuyển động bàn tay rõ đến như vậy - (Ảnh: Đại học Carnegie Mellon).

Các nhà nghiên cứu tại Viện Robotics của Đại học Carnegie Mellon đã phát triển mã mới bằng cách sử dụng Studio Panoptic. Máy vòm hai tầng này được trang bị 500 máy quay, tạo ra hàng trăm điểm quan sát mỗi hành động trong một lần quay.

Hệ thống nhìn thấy sự chuyển động của con người bằng cách sử dụng một mô hình 2D. Điều này cho phép nó theo dõi chuyển động trong thời gian thực, ghi lại mọi thứ từ cử chỉ tay đến chuyển động của miệng người và nó thậm chí có thể theo dõi nhiều người cùng một lúc.

Yaser Sheikh, phó Giáo sư về robot, cho biết: "Chúng ta giao tiếp bằng sự chuyển động của cơ thể nhiều như giao tiếp bằng giọng nói vậy. Nhưng các máy tính thì ít hoặc ít bị mù nhận diện ngôn ngữ không lời".

Theo dõi nhiều người là thách thức lớn đối với máy tính và, việc phát hiện cử động tay thậm chí còn nhiều trở ngại hơn.

Mặc dù tập hợp dữ liệu hình ảnh trên bàn tay con người còn hạn chế hơn nhiều so với khuôn mặt hay trên vùng thân thể khác, nhưng Studio Panoptic đã cho phép robot nhận diện các chuyển động bàn tay chưa từng thấy trước đó.

Nhóm nghiên cứu hi vọng sẽ sớm chuyển từ mô hình dạng người 2D sang 3D
Nhóm nghiên cứu hi vọng sẽ sớm chuyển từ mô hình dạng người 2D sang 3D để cải thiện việc dò, hiểu chuyển động cơ thể người của máy - (Ảnh: Đại học Carnegie Mellon).

Cách tiếp cận này cuối cùng có thể được sử dụng trong nhiều ứng dụng, ví dụ như giúp nâng cao khả năng xe tự lái để dự đoán chuyển động kế tiếp của người đi bộ. Nó cũng có thể được sử dụng trong phân tích thể thao, hoặc chẩn đoán hành vi.

Các nhà nghiên cứu sẽ giới thiệu thành tựu này tại CVPR 2017, Hội nghị về Tầm nhìn Máy tính và Hoá học, ngày 21 - 26/7 tại Honolulu.

Hiện tại, họ đã phát hành mã này cho các nhóm nghiên cứu khác để mở rộng khả năng của nó. Cuối cùng, nhóm nghiên cứu hy vọng sẽ chuyển từ mô hình 2D sang mô hình 3D, sử dụng Panoptic Studio để cải thiện việc dò chuyển động cơ thể, khuôn mặt và bàn tay.


Nguồn: /

Nếu chip cấy não của Elon Musk thực hiện hành động có hại, người hay máy sẽ phải chịu trách nhiệm?

Các ngành công nghệ

Từ năm 1999, hai triết gia người Úc và người Anh nêu lên một thí nghiệm giả định về não bộ. Năm 2024, giả thuyết trở thành hiện thực.

Trung Quốc hướng tới tàu ngầm laser di chuyển với tốc độ âm thanh

Các ngành công nghệ

Trung Quốc dường như đang vạch ra những chân trời mới bằng việc phát triển tàu ngầm chạy bằng công nghệ laser.

Robot hình người đang hoạt động trong nhà máy của Tesla như thế nào?

Các ngành công nghệ

Optimus, được giới thiệu lần đầu tiên bởi Tesla vào năm 2021, là một robot hình người có tham vọng cách mạng hóa ngành công nghiệp tự động hóa.

Mẫu máy bay siêu thanh bay nhanh hơn Concorde

Các ngành công nghệ

Máy bay XB-70 Valkyrie tốc độ 3.218 km/h của Không quân Mỹ đã truyền cảm hứng thiết kế cho máy bay siêu thanh dân sự sau này là Concorde và Tupolev Tu-144.

Drone biến thành phao cứu người khi đáp xuống nước

Các ngành công nghệ

Drone TY-3R có thể giúp hai người lớn nổi trên mặt nước, có phạm vi liên lạc 1,1km và hoạt động được 10 phút sau một lần sạc.

Trung Quốc tạo ra loại “pin nước” mạnh gần gấp đôi pin lithium nhưng giá… không đổi

Các ngành công nghệ

Loại pin nước mới được kì vọng sẽ làm thay đổi bộ mặt ngành xe điện tương lai.

Pin sạc siêu nhanh đầu tiên trên thế giới cho eVTOL

Các ngành công nghệ

Hai công ty hợp tác phát triển pin cho máy bay cất hạ cánh thẳng đứng chạy điện (eVTOL), chỉ mất vài phút để sạc từ 30% lên 80%.

Lưới điện thông minh ngăn chặn mất điện

Các ngành công nghệ

Chattanooga, Tennessee, là một trong những nơi có lưới điện tiên tiến nhất ở Mỹ, có thể tự khắc phục sự cố và phục hồi cung cấp điện trong vòng vài giây.

Giải đua xe AI thách thức giới hạn công nghệ tự lái

Các ngành công nghệ

Giải đua xe tự động Autonomous Racing League (A2RL) diễn ra trên đường đua Yas Marina ở Abu Dhabi với chiến thắng thuộc về đội đua đến từ Đại học Kỹ thuật Munich (TUM).

Công chiếu bộ phim đầu tiên hoàn toàn do AI viết kịch bản

Các ngành công nghệ

Liên hoan phim ngắn và châu Á 2024 sẽ tập trung vào các vấn đề đang nổi cộm toàn cầu, đồng thời trình chiếu bộ phim đầu tiên hoàn toàn do trí tuệ nhân tạo (AI) viết kịch bản.