Danh sách bài viết

Càng thông minh, trí tuệ nhân tạo càng thích giấu dốt?

Cập nhật: 11/10/2024

Một nhóm nghiên cứu tại Đại học Bách khoa Valencia, Tây Ban Nha, phát hiện rằng khi các mô hình ngôn ngữ lớn (LLM) trở nên lớn hơn và tinh vi hơn, chúng có xu hướng ít thừa nhận với người dùng rằng mình không biết câu trả lời.

Trong nghiên cứu được công bố trên tạp chí Nature, nhóm đã kiểm tra phiên bản mới nhất của ba chatbot trí tuệ nhân tạo AI phổ biến nhất về phản hồi, độ chính xác và khả năng người dùng phát hiện câu trả lời sai.

Khi LLM trở nên lớn hơn và tinh vi hơn, chúng lại có xu hướng ít cởi mở hơn.
Khi LLM trở nên lớn hơn và tinh vi hơn, chúng lại có xu hướng ít cởi mở hơn. (Ảnh minh họa).

Để kiểm tra độ chính xác của ba LLM phổ biến nhất là BLOOM, LLaMA và GPT, nhóm nghiên cứu đã đưa ra hàng nghìn câu hỏi và so sánh câu trả lời nhận được với phản hồi của các phiên bản trước đó cho cùng một câu hỏi.

Họ cũng đa dạng hóa chủ đề, bao gồm toán học, khoa học, câu đố chữ và địa lý, cũng như khả năng tạo văn bản hoặc thực hiện các hành động như sắp xếp danh sách.

Kết quả nghiên cứu cho thấy một số xu hướng đáng chú ý.

Độ chính xác nói chung của các chatbot được cải thiện qua mỗi phiên bản mới, nhưng vẫn giảm khi đối mặt với những câu hỏi khó hơn.

Điều đáng ngạc nhiên là khi LLM trở nên lớn hơn và tinh vi hơn, chúng lại có xu hướng ít cởi mở hơn về khả năng trả lời chính xác của mình.

Trong các phiên bản trước đây, hầu hết LLM sẽ thẳng thắn thông báo với người dùng khi chúng không thể tìm thấy câu trả lời hoặc cần thêm thông tin.

Ngược lại, các phiên bản mới hơn có xu hướng đoán nhiều hơn, dẫn đến việc đưa ra nhiều câu trả lời hơn nói chung, bao gồm cả đúng và sai.

Đáng lo ngại hơn, nghiên cứu phát hiện rằng tất cả các LLM đôi khi vẫn đưa ra câu trả lời không chính xác ngay cả đối với các câu hỏi dễ, cho thấy độ tin cậy của chúng vẫn còn là một vấn đề cần được cải thiện.

Những phát hiện này nêu bật một nghịch lý trong sự phát triển của AI: mặc dù các mô hình ngày càng mạnh mẽ hơn, chúng cũng có thể trở nên kém minh bạch hơn về những hạn chế của mình.

Điều này đặt ra những thách thức mới trong việc sử dụng và tin tưởng vào các hệ thống AI, đòi hỏi người dùng phải thận trọng hơn và các nhà phát triển cần tập trung vào việc cải thiện không chỉ độ chính xác mà còn cả khả năng "tự nhận thức" của các mô hình.


    10 phát minh khoa học - công nghệ ấn tượng

    Các ngành công nghệ

    Thế giới khoa học - công nghệ tuần qua tràn đầy sắc màu lấp lánh, từ chuột phát quang, hệ thống mạng không dây vô hình đến sô cô la hình chiếu.

    Robot hình cầu lưỡng cư hỗ trợ cảnh sát Trung Quốc tuần tra

    Các ngành công nghệ

    Trang bị súng lưới, bình xịt hơi cay, bom khói và bộ phát sóng âm, robot RT-G có thể xử lý các mối đe dọa ở khoảng cách gần.

    Trung Quốc phát triển radar laser có thể "mò kim dưới biển"

    Các ngành công nghệ

    Hệ thống lidar (radar laser) của Đại học Hạ Môn có thể hoạt động ở độ sâu một kilomet và phát hiện dầu tràn từ khoảng cách 12 m.

    Đội quân robot hình người làm việc trong nhà máy Trung Quốc

    Các ngành công nghệ

    Công ty khởi nghiệp robot MagicLab giới thiệu đội robot hình người ở một nhà máy để tập huấn những công việc đa dạng.

    Động cơ kích nổ mới giúp định hình tương lai ngành hàng không siêu thanh

    Các ngành công nghệ

    Tại Trung Quốc, tiến bộ công nghệ diễn ra với tốc độ chóng mặt, bất kể lĩnh vực nào và mới đây họ đã trình bày một động cơ phản lực mới hiệu suất cao.

    Elon Musk khoe khả năng leo đồi của robot hình người

    Các ngành công nghệ

    Trong video mới nhất, Elon Musk và công ty Tesla phô diễn kỹ năng đi trên địa hình gồ ghề mà không bị té ngã của robot hình người Optimus.

    Gián cyborg khổng lồ có thể gia nhập “đội tìm kiếm và cứu hộ” trong tương lai

    Các ngành công nghệ

    Các nhà nghiên cứu tại Australia gắn "balô" vào bọ cánh cứng và gián để điều khiển chuyển động của chúng, hy vọng những động vật lai máy móc này có thể trở thành "nhân viên" cứu hộ trong tương lai.

    Robot Nhật Bản hình người lập kỷ lục ném bóng rổ xa nhất

    Các ngành công nghệ

    Tổ chức Kỷ lục Thế giới Guinness hôm 4/12 công bố thước phim robot hình người CUE6 của Toyota thực hiện cú ném bóng rổ từ khoảng cách 24,55 m.

    Đại học ở Trung Quốc phát triển thành công vật liệu tàng hình giống tắc kè hoa

    Các ngành công nghệ

    Vật liệu tàng hình do nhóm nghiên cứu ở Đại học Khoa học và Công nghệ điện Trung Quốc phát triển sử dụng thay đổi phân tử để hòa lẫn hoàn hảo vào môi trường.

    Death Clock – Ứng dụng AI có thể dự đoán tuổi thọ của con người

    Các ngành công nghệ

    Death Clock – ứng dụng sáng tạo sử dụng trí tuệ nhân tạo (AI) – có khả năng dự đoán chính xác tuổi thọ của một người dựa trên một số yếu tố như chế độ ăn uống.