AI mới của Facebook cho phép hoán đổi hình dáng con người trong các video thực tế

294

Những tưởng DeepFakes – AI cho phép ghép khuôn mặt của người nổi tiếng vào bất cứ đoạn video nào mà bạn yêu thích đã khiến người dùng vô cùng ấn tượng, hệ thống AI mới của Facebook với tên gọi DensePose còn sở hữu khả năng “khủng” hơn rất nhiều.

Cuối tuần trước, phòng nghiên cứu AI của Facebook (FAIR) đã hé lộ chi tiết về một mạng neural có khả năng phân bổ hình ảnh 2D của con người trong các đoạn video.Về cơ bản, nhóm nghiên cứu đã “dạy” cho hệ thống AI cách chỉnh sửa làn da hay trang phục cho những nhân vật xuất hiện trong video ở thời gian thực.

Nói một cách dễ hiểu, chỉ với một thao tác bấm nút đơn giản, bạn có thể biến tất cả những người có mặt trong bất cứ đoạn phim nào thành những nhân vật mà bạn yêu thích hoặc do bạn tự sáng tạo ra.

Mặc dù mạng neural để tạo ra hình ảnh 2D không phải là một công nghệ quá mới trong lĩnh vực AI, nhưng DensePose chính là hệ thống đầu tiên có thể thực hiện tác vụ này trong thời gian thực. Đặc biệt, nó cũng có khả năng “kết nối các điểm ảnh” một cách hoàn hảo mà không cần sử dụng những cảm biến chiều sâu. Được biết, đây là sản phẩm hợp tác giữa các nhà nghiên cứu Natalia Neverona và Iasonas Kokkinos của FAIR với Riza Alp Guler của INRIA.

DensePose sử dụng một mạng neural phức tạp ban đầu được tạo dựng từ nguồn thông tin đầu vào khổng lồ lên đến 5 triệu điểm dữ liệu được thu thập và phân tích từ 50.000 bức ảnh về các bộ phận con người. Sau khi hiểu rõ cơ chế con người quan sát lẫn nhau, mạng lưới này sẽ “huấn luyện” cho hệ thống AI của DensePose cách quan sát con người giống như vậy.

Và kết quả thu được là AI có thể sử dụng nguồn dữ liệu đầu vào là hình ảnh RGB 2D để áp dụng lên tất cả những người xuất hiện trong một đoạn video. Thay vì ghép khuôn mặt của người nổi tiếng lên cơ thể của một người khác như DeepFakes, bạn hoàn toàn có thể tùy chỉnh ngoại hình của một người ngay trong đoạn video gốc, giống như đang chơi Minecraft vậy.

DensePose cho phép tùy ý chỉnh sửa ngoại hình của những người xuất hiện trong một đoạn video.

Một hệ thống AI với khả năng tách nhiều người trong cùng một đoạn video và tái tạo hình ảnh 2D sẽ cực kỳ hữu ích trong lĩnh vực pháp luật. Ví dụ, nó có thể được sử dụng để phân tích từng đối tượng trong một đoạn phim mà camera công cộng ghi lại, sau đó tạo ra những chỉ mục tìm kiếm cụ thể như ngôn ngữ cơ thể hay các chuyển động đáng ngờ để tìm ra đối tượng khả nghi nhất.

Theo báo cáo của các nhà nghiên cứu, DensePose cũng sẽ đóng vai trò quan trọng trong ngành công nghiệp game sau khi được tối ưu hóa hơn trong tương lai. Nó có thể thay đổi hoàn toàn mô hình nhân vật trong các video trò chơi. Và nó có thể đóng vai trò quan trọng trong việc tạo ra các nhân vật AR để tương tác với người chơi trong thời gian thực.

DensePose cần chạy trên một cỗ PC cao cấp với card đồ họa GTX 1080. Ở thời điểm hiện tại, AI của DensePose chưa đạt đến trình độ “lừa” được chúng ta khi mới chỉ có thể hoạt động ở tốc độ 20 – 26 fps cho mỗi bức ảnh 240 x 320 hoặc 4 – 5 fps cho mỗi bức ảnh 800 x 1100.

Theo TheNextweb

Tin liên quan: