Danh sách bài viết

Hệ thống AI "quái dị" này sẽ tạo ra hình ảnh từ các nội dung chữ được nhập vào

Cập nhật: 09/10/2020

Ở thời điểm hiện tại, trí thông minh nhân tạo đang chứng tỏ rằng chúng vô cùng giỏi ở 2 lĩnh vực: đưa ra những quyết định mang tính logic và nhận diện mẫu.

Nhờ có machine learning – thứ giúp AI tự dạy mình dựa trên các dữ liệu nhập có chọn lọc, giờ đây ta đã có các phần mềm dự đoán chính xác tính cách của một con người chỉ nhờ bằng chuyển động mắt của họ.

Chưa hết, chúng còn có thể viết được tiểu thuyết viễn tưởng, như tập mới của cậu bé phép thuật Harry Potter và Chân dung của Đống tro Khổng lồ. Mới đây, một nhóm nghiên cứu đã chế tạo thành công một hệ thống cho phép biến đổi những dòng chữ nhập vào thành một chuỗi các hình ảnh. Mục đích của dự án này nghe rất sáng tạo và đột phá, thế nhưng kết quả thì … hơi rùng rợn.


Con hươu cao cổ này có màu xanh, hồng và đỏ, trên người nó có một triệu đốm nâu và nó thích ngắm hoàng hôn với bạn bè của mình.

Trên thực tế, tất cả những lần thử đều nhận được lời đáp khá kỳ dị từ AI, những con vật trong hình đều có hình dạng rất quái lạ. "Một con mèo đeo bịt mắt và có cái miệng màu xanh", thì trí tuệ nhân tạo cho ra hình một cái móng vuốt mèo được hình thành bởi miệng mèo.

Con cá heo này đang lườm nguýt đối thủ truyền kiếp của mình.
Con cá heo này đang lườm nguýt đối thủ truyền kiếp của mình.

Hệ thống AI này đã được đăng tải lên web nhờ nhóm nhà nghiên cứu Cristobal Valenzuela của đại học New York – những người xây dựng các công cụ machine learning miễn phí cho cộng đồng. Phần mềm này thực chất được dựng nên bởi nhóm nhà khoa học ở địa học Lehigh. Họ hy vọng có thể viết ra được những thuật toán nhằm cải thiện khả năng nhận diện và hiểu hình ảnh của các chương trình machine learning.

Loại trí thông minh nhân tạo này (được gọi là AttnGAN) đã đạt được kết quả khá ấn tượng. Với một câu nói dài, ví dụ như "con chim này có màu đỏ và trắng, mỏ của nó rất ngắn", nó có thể xuất ra được một chuỗi các hình ảnh tương ứng với mỗi phần của câu.

Nhánh cần tây đang bị đốt trên đống lửa.
Nhánh cần tây đang bị đốt trên đống lửa.

Thay vì chỉ có 1 mạng learning để nhận diện hoặc xuất hình ảnh, GAN sử dụng 2 mạng, một để tạo ra hình ảnh, hai là để điều chỉnh nó sao cho khớp với mô tả. Điều này cho phép cả hai hoạt động mượt mà, trơn tru hơn trong quá trình học, giúp đẩy nhanh tiến độ và tạo ra các tấm ảnh chính xác hơn.

Như chính tác giả đã đề cập tới "việc tự động tạo ra các hình ảnh dựa trên ngôn ngữ miêu tả tự nhiên vốn là một vấn đề cơ bản". Họ giải thích rằng phương pháp thường dùng cho loại AI này là đánh giá cả câu hoặc file chữ để cố gắng tìm ra hình ảnh yêu cầu là gì. Kết quả của cách thức này là lúc được, lúc không.

Chuối và nho đang đánh nhau.
Chuối và nho đang đánh nhau.

Vì vậy, họ quyết định đi theo hướng đi mới, đó là phân tích ngay mỗi phần câu nói đang được nhập vào. Đây là một phương thức cực kỳ phức tạp bởi về cơ bản, máy móc phải bắt chước những gì mà trí óc con người sẽ thực hiện trong hoàn cảnh ấy nhờ vô vàn thuật toán khác nhau.

Đây không phải là một sản phẩm hoàn hảo, tuy nhiên nó là một bước tiến bộ đáng kể. Nhờ có kiến thức sâu rộng về toàn học mà phần mềm của AI này vượt trội hoàn toàn so với các trí tuệ tạo ảnh khác. Ý tưởng đằng sau dự án này là việc nhận ra các hình ảnh là một chuyện, còn việc tự kết xuất ra một hình từ trí óc của riêng bạn? Đó là một câu chuyện khác.


    Nguồn: /

    Nếu chip cấy não của Elon Musk thực hiện hành động có hại, người hay máy sẽ phải chịu trách nhiệm?

    Các ngành công nghệ

    Từ năm 1999, hai triết gia người Úc và người Anh nêu lên một thí nghiệm giả định về não bộ. Năm 2024, giả thuyết trở thành hiện thực.

    Trung Quốc hướng tới tàu ngầm laser di chuyển với tốc độ âm thanh

    Các ngành công nghệ

    Trung Quốc dường như đang vạch ra những chân trời mới bằng việc phát triển tàu ngầm chạy bằng công nghệ laser.

    Robot hình người đang hoạt động trong nhà máy của Tesla như thế nào?

    Các ngành công nghệ

    Optimus, được giới thiệu lần đầu tiên bởi Tesla vào năm 2021, là một robot hình người có tham vọng cách mạng hóa ngành công nghiệp tự động hóa.

    Mẫu máy bay siêu thanh bay nhanh hơn Concorde

    Các ngành công nghệ

    Máy bay XB-70 Valkyrie tốc độ 3.218 km/h của Không quân Mỹ đã truyền cảm hứng thiết kế cho máy bay siêu thanh dân sự sau này là Concorde và Tupolev Tu-144.

    Drone biến thành phao cứu người khi đáp xuống nước

    Các ngành công nghệ

    Drone TY-3R có thể giúp hai người lớn nổi trên mặt nước, có phạm vi liên lạc 1,1km và hoạt động được 10 phút sau một lần sạc.

    Trung Quốc tạo ra loại “pin nước” mạnh gần gấp đôi pin lithium nhưng giá… không đổi

    Các ngành công nghệ

    Loại pin nước mới được kì vọng sẽ làm thay đổi bộ mặt ngành xe điện tương lai.

    Pin sạc siêu nhanh đầu tiên trên thế giới cho eVTOL

    Các ngành công nghệ

    Hai công ty hợp tác phát triển pin cho máy bay cất hạ cánh thẳng đứng chạy điện (eVTOL), chỉ mất vài phút để sạc từ 30% lên 80%.

    Lưới điện thông minh ngăn chặn mất điện

    Các ngành công nghệ

    Chattanooga, Tennessee, là một trong những nơi có lưới điện tiên tiến nhất ở Mỹ, có thể tự khắc phục sự cố và phục hồi cung cấp điện trong vòng vài giây.

    Giải đua xe AI thách thức giới hạn công nghệ tự lái

    Các ngành công nghệ

    Giải đua xe tự động Autonomous Racing League (A2RL) diễn ra trên đường đua Yas Marina ở Abu Dhabi với chiến thắng thuộc về đội đua đến từ Đại học Kỹ thuật Munich (TUM).

    Công chiếu bộ phim đầu tiên hoàn toàn do AI viết kịch bản

    Các ngành công nghệ

    Liên hoan phim ngắn và châu Á 2024 sẽ tập trung vào các vấn đề đang nổi cộm toàn cầu, đồng thời trình chiếu bộ phim đầu tiên hoàn toàn do trí tuệ nhân tạo (AI) viết kịch bản.