Danh sách bài viết

Hệ thống AI "quái dị" này sẽ tạo ra hình ảnh từ các nội dung chữ được nhập vào

Cập nhật: 09/10/2020

Ở thời điểm hiện tại, trí thông minh nhân tạo đang chứng tỏ rằng chúng vô cùng giỏi ở 2 lĩnh vực: đưa ra những quyết định mang tính logic và nhận diện mẫu.

Nhờ có machine learning – thứ giúp AI tự dạy mình dựa trên các dữ liệu nhập có chọn lọc, giờ đây ta đã có các phần mềm dự đoán chính xác tính cách của một con người chỉ nhờ bằng chuyển động mắt của họ.

Chưa hết, chúng còn có thể viết được tiểu thuyết viễn tưởng, như tập mới của cậu bé phép thuật Harry Potter và Chân dung của Đống tro Khổng lồ. Mới đây, một nhóm nghiên cứu đã chế tạo thành công một hệ thống cho phép biến đổi những dòng chữ nhập vào thành một chuỗi các hình ảnh. Mục đích của dự án này nghe rất sáng tạo và đột phá, thế nhưng kết quả thì … hơi rùng rợn.


Con hươu cao cổ này có màu xanh, hồng và đỏ, trên người nó có một triệu đốm nâu và nó thích ngắm hoàng hôn với bạn bè của mình.

Trên thực tế, tất cả những lần thử đều nhận được lời đáp khá kỳ dị từ AI, những con vật trong hình đều có hình dạng rất quái lạ. "Một con mèo đeo bịt mắt và có cái miệng màu xanh", thì trí tuệ nhân tạo cho ra hình một cái móng vuốt mèo được hình thành bởi miệng mèo.

Con cá heo này đang lườm nguýt đối thủ truyền kiếp của mình.
Con cá heo này đang lườm nguýt đối thủ truyền kiếp của mình.

Hệ thống AI này đã được đăng tải lên web nhờ nhóm nhà nghiên cứu Cristobal Valenzuela của đại học New York – những người xây dựng các công cụ machine learning miễn phí cho cộng đồng. Phần mềm này thực chất được dựng nên bởi nhóm nhà khoa học ở địa học Lehigh. Họ hy vọng có thể viết ra được những thuật toán nhằm cải thiện khả năng nhận diện và hiểu hình ảnh của các chương trình machine learning.

Loại trí thông minh nhân tạo này (được gọi là AttnGAN) đã đạt được kết quả khá ấn tượng. Với một câu nói dài, ví dụ như "con chim này có màu đỏ và trắng, mỏ của nó rất ngắn", nó có thể xuất ra được một chuỗi các hình ảnh tương ứng với mỗi phần của câu.

Nhánh cần tây đang bị đốt trên đống lửa.
Nhánh cần tây đang bị đốt trên đống lửa.

Thay vì chỉ có 1 mạng learning để nhận diện hoặc xuất hình ảnh, GAN sử dụng 2 mạng, một để tạo ra hình ảnh, hai là để điều chỉnh nó sao cho khớp với mô tả. Điều này cho phép cả hai hoạt động mượt mà, trơn tru hơn trong quá trình học, giúp đẩy nhanh tiến độ và tạo ra các tấm ảnh chính xác hơn.

Như chính tác giả đã đề cập tới "việc tự động tạo ra các hình ảnh dựa trên ngôn ngữ miêu tả tự nhiên vốn là một vấn đề cơ bản". Họ giải thích rằng phương pháp thường dùng cho loại AI này là đánh giá cả câu hoặc file chữ để cố gắng tìm ra hình ảnh yêu cầu là gì. Kết quả của cách thức này là lúc được, lúc không.

Chuối và nho đang đánh nhau.
Chuối và nho đang đánh nhau.

Vì vậy, họ quyết định đi theo hướng đi mới, đó là phân tích ngay mỗi phần câu nói đang được nhập vào. Đây là một phương thức cực kỳ phức tạp bởi về cơ bản, máy móc phải bắt chước những gì mà trí óc con người sẽ thực hiện trong hoàn cảnh ấy nhờ vô vàn thuật toán khác nhau.

Đây không phải là một sản phẩm hoàn hảo, tuy nhiên nó là một bước tiến bộ đáng kể. Nhờ có kiến thức sâu rộng về toàn học mà phần mềm của AI này vượt trội hoàn toàn so với các trí tuệ tạo ảnh khác. Ý tưởng đằng sau dự án này là việc nhận ra các hình ảnh là một chuyện, còn việc tự kết xuất ra một hình từ trí óc của riêng bạn? Đó là một câu chuyện khác.


    Nguồn: /

    Thước phim về cuộc chiến đầu tiên giữa AI và phi công

    Các ngành công nghệ

    Một chiếc tiêm kích F-16 do trí tuệ nhân tạo (AI) điều khiển tham gia trận không chiến đầu tiên với máy bay F-16 khác do người lái.

    Phát triển thiết bị bay không người lái chạy bằng nhiên liệu hydro

    Các ngành công nghệ

    Với kinh phí đầu tư ban đầu là 3,6 triệu AUD (2,32 triệu USD), dự án Wildu sẽ phát triển một loại thiết bị bay không người lái y tế đặc biệt, chạy bằng nhiên liệu hydro.

    Nhà vệ sinh tương lai, bồn cầu sẽ biết... bắt bệnh

    Các ngành công nghệ

    Nhà vệ sinh với các cải tiến có thể giảm bớt gánh nặng cho hệ thống chăm sóc sức khỏe, đồng thời giúp người lớn tuổi có thể ở nhà an toàn.

    Boston Dynamics công bố dòng robot Atlas mới, thực hiện được những động tác bất khả thi với con người

    Các ngành công nghệ

    Gần một thập kỷ qua, robot Atlas do công ty công nghệ Boston Dynamics phát triển đã nhiều lần xuất hiện trên các phương tiện truyền thông đại chúng.

    Siêu máy tính AI giống bản sao kỹ thuật số của Trái đất

    Các ngành công nghệ

    Các nhà khoa học tạo ra một "bản sao kỹ thuật số" của Trái Đất, có thể dự đoán thời tiết nhanh hơn nhiều so với dịch vụ thông thường.

    Cuộc thi người đẹp AI đầu tiên trên thế giới

    Các ngành công nghệ

    Những người đẹp giành vị trí cao trong cuộc thi sắc đẹp trí tuệ nhân tạo (AI) đầu tiên trên thế giới sẽ nhận được các phần giải thưởng trị giá lên tới hơn 20.000 USD.

    Google Photos mở nhiều tính năng chỉnh sửa AI miễn phí tới người dùng

    Các ngành công nghệ

    Các công cụ chỉnh sửa hình ảnh sử dụng AI (trí tuệ nhân tạo) sẽ được Google Photos cung cấp miễn phí tới cả người dùng iOS lẫn Android.

    Trung Quốc phát triển thành công vòi rồng thông minh được điều khiển bằng AI

    Các ngành công nghệ

    Các nhà nghiên cứu Trung Quốc phát triển thành công vòi rồng thông minh đầu tiên trên thế giới được điều khiển bằng trí tuệ nhân tạo (AI).

    Elon Musk nói AI sắp vượt trội hơn người thông minh nhất

    Các ngành công nghệ

    Giám đốc điều hành Tesla Elon Musk dự đoán trí tuệ nhân tạo (AI) thông minh hơn người thông minh nhất có thể được phát triển vào năm 2025 hoặc 2026.

    Robot đã tự biết lừa bóng, qua người, ghi bàn

    Các ngành công nghệ

    Nhờ phương pháp đào tạo AI mới, những chú robot đã có thể tự động cải thiện kỹ năng và tham gia vào một trận bóng mô phỏng.