Danh sách bài viết

Đến lượt AI của Elon Musk tích hợp tính năng nhìn, nghe, nói như con người

Cập nhật: 22/05/2024

Grok, chatbot AI do xAI - công ty của Elon Musk phát triển - đang trong quá trình được tích hợp khả năng xử lý thông tin đa phương tiện, cho phép người dùng tương tác bằng cả hình ảnh và văn bản.

Grok - sản phẩm trí tuệ nhân tạo (AI) đến từ xAI - công ty do Elon Musk sáng lập, được kỳ vọng sẽ sớm được nâng cấp với khả năng tiếp nhận thông tin đa phương tiện. Thông tin này được hé lộ thông qua tài liệu dành cho nhà phát triển được xAI công bố.

 Grok được đánh giá là “tân binh” trong lĩnh vực AI
 Grok được đánh giá là “tân binh” trong lĩnh vực AI.

Vào tháng 3/2024, Grok đã có bước tiến đáng kể với phiên bản Grok 1.5, sở hữu khả năng lập luận được cải thiện đáng kể. Trước đó, trong một bài đăng trên blog vào tháng trước, xAI từng úp mở về việc Grok-1.5V sẽ cung cấp "các mô hình đa phương thức trong một số lĩnh vực nhất định". Bản cập nhật tài liệu dành cho nhà phát triển gần đây dường như cho thấy xAI đang chuẩn bị cho ra mắt một mô hình AI mới. Điều này đồng nghĩa với việc người dùng có thể tải ảnh lên Grok và nhận được câu trả lời bằng văn bản. Cụ thể, tài liệu hướng dẫn cách thức các nhà phát triển có thể sử dụng bộ công cụ phát triển phần mềm (SDK) của xAI để tạo ra phản hồi dựa trên cả văn bản và hình ảnh. Kịch bản Python mẫu minh họa cách đọc tệp hình ảnh, thiết lập lời nhắc văn bản và sử dụng xAI SDK để tạo phản hồi.

Ra mắt vào tháng 11/2023 và chỉ dành riêng cho người dùng trả phí X Premium Plus, Grok được đánh giá là “tân binh” trong lĩnh vực AI so với các đối thủ nặng ký như ChatGPT của OpenAI. Điểm đặc biệt của Grok là khả năng tiếp cận thông tin theo thời gian thực, bao gồm cả các bài đăng trên nền tảng X. Theo thông tin từ xAI, mô hình Grok được huấn luyện dựa trên "nhiều nguồn dữ liệu văn bản công khai trên Internet tính đến quý 3 năm 2023 và tập dữ liệu do người đánh giá xem xét và tuyển chọn".

Bài đăng trên blog của X cũng khẳng định Grok-1 không được huấn luyện trên dữ liệu X (bao gồm cả các bài đăng X công khai). Tuy nhiên, xAI cũng thừa nhận rằng các điểm chuẩn cho mô hình ngôn ngữ lớn thường bị chỉ trích vì các mô hình có thể hoạt động tốt trên điểm chuẩn nếu các điểm chuẩn đó được đưa vào dữ liệu đào tạo của chúng. Điều này giống như việc ghi nhớ câu trả lời trong bài kiểm tra, thay vì thực sự hiểu nội dung.

Mặc dù vậy, theo một bài đăng trên blog của xAI, Grok 1.5 đang dần thu hẹp khoảng cách với GPT-4 trên nhiều tiêu chuẩn đánh giá, từ cấp tiểu học đến các cuộc thi cấp trung học. Chatbot đa phương thức được xem là đích đến tiếp theo của cuộc đua AI. Nhiều ông lớn trong ngành như Google đã công bố những bước tiến mới tại sự kiện Google I/O, trong khi . Việc thiếu hụt khả năng đa phương tiện đã khiến Grok bị tụt lại phía sau cho đến thời điểm hiện tại. Liệu với những nỗ lực nâng cấp, Grok có thể tạo nên bất ngờ trong cuộc đua đầy thử thách này?


    Nguồn: /

    10 phát minh khoa học - công nghệ ấn tượng

    Các ngành công nghệ

    Thế giới khoa học - công nghệ tuần qua tràn đầy sắc màu lấp lánh, từ chuột phát quang, hệ thống mạng không dây vô hình đến sô cô la hình chiếu.

    Robot hình cầu lưỡng cư hỗ trợ cảnh sát Trung Quốc tuần tra

    Các ngành công nghệ

    Trang bị súng lưới, bình xịt hơi cay, bom khói và bộ phát sóng âm, robot RT-G có thể xử lý các mối đe dọa ở khoảng cách gần.

    Trung Quốc phát triển radar laser có thể "mò kim dưới biển"

    Các ngành công nghệ

    Hệ thống lidar (radar laser) của Đại học Hạ Môn có thể hoạt động ở độ sâu một kilomet và phát hiện dầu tràn từ khoảng cách 12 m.

    Đội quân robot hình người làm việc trong nhà máy Trung Quốc

    Các ngành công nghệ

    Công ty khởi nghiệp robot MagicLab giới thiệu đội robot hình người ở một nhà máy để tập huấn những công việc đa dạng.

    Động cơ kích nổ mới giúp định hình tương lai ngành hàng không siêu thanh

    Các ngành công nghệ

    Tại Trung Quốc, tiến bộ công nghệ diễn ra với tốc độ chóng mặt, bất kể lĩnh vực nào và mới đây họ đã trình bày một động cơ phản lực mới hiệu suất cao.

    Elon Musk khoe khả năng leo đồi của robot hình người

    Các ngành công nghệ

    Trong video mới nhất, Elon Musk và công ty Tesla phô diễn kỹ năng đi trên địa hình gồ ghề mà không bị té ngã của robot hình người Optimus.

    Gián cyborg khổng lồ có thể gia nhập “đội tìm kiếm và cứu hộ” trong tương lai

    Các ngành công nghệ

    Các nhà nghiên cứu tại Australia gắn "balô" vào bọ cánh cứng và gián để điều khiển chuyển động của chúng, hy vọng những động vật lai máy móc này có thể trở thành "nhân viên" cứu hộ trong tương lai.

    Robot Nhật Bản hình người lập kỷ lục ném bóng rổ xa nhất

    Các ngành công nghệ

    Tổ chức Kỷ lục Thế giới Guinness hôm 4/12 công bố thước phim robot hình người CUE6 của Toyota thực hiện cú ném bóng rổ từ khoảng cách 24,55 m.

    Đại học ở Trung Quốc phát triển thành công vật liệu tàng hình giống tắc kè hoa

    Các ngành công nghệ

    Vật liệu tàng hình do nhóm nghiên cứu ở Đại học Khoa học và Công nghệ điện Trung Quốc phát triển sử dụng thay đổi phân tử để hòa lẫn hoàn hảo vào môi trường.

    Death Clock – Ứng dụng AI có thể dự đoán tuổi thọ của con người

    Các ngành công nghệ

    Death Clock – ứng dụng sáng tạo sử dụng trí tuệ nhân tạo (AI) – có khả năng dự đoán chính xác tuổi thọ của một người dựa trên một số yếu tố như chế độ ăn uống.