Danh sách bài viết

Microsoft thầm lặng công bố phần mềm AI mới, nhại giọng con người chỉ với 3 giây thu âm

Cập nhật: 08/09/2023

Các nhà khoa học công tác tại Microsoft vừa công bố một báo cáo liên quan tới một hệ thống tạo ra giọng nói từ văn bản. Có tên gọi VALL-E, hệ thống mới của Microsoft không khiến nhiều người bất ngờ, khi những ví dụ kiểu “chị Google” đã quá nổi tiếng với người dùng Internet.

Nhưng khi đọc báo cáo, chúng ta mới có thể thấy những chi tiết gây bất ngờ hay thậm chí rùng mình. Các nhà khoa học khẳng định VALL-E “có thể được sử dụng để tổng hợp giọng nói cá nhân với chất lượng cao, chỉ với dữ liệu đầu vào là một đoạn thu âm dài 3 giây của một người nói không rõ mặt”.

Phần mềm tạo giọng nói ảo VALL-E có tiềm năng, mà cũng mang nhiều nguy cơ
Phần mềm tạo giọng nói ảo VALL-E có tiềm năng, mà cũng mang nhiều nguy cơ - (Ảnh: Internet).

Hay nói một cách khác, hệ thống của Microsoft chỉ cần nghe chúng ta nói 3 giây là đã có thể tổng hợp được một giọng nói giống với nguyên bản. Theo báo cáo, cơ sở dữ liệu được sử dụng trong huấn luyện VALL-E do Meta (công ty mẹ của Facebook) tổng hợp nên, và bao gồm 60.000 giờ thoại được thực hiện bởi 7.000 người.

Phóng viên công nghệ làm việc tự do Chris Matyszczyk đã nghe thử một số đoạn ghi âm, và đưa ra cảm nhận của mình trên trang tin ZDNet. Ông nghe một giọng nam phát biểu trong 3 giây, nghe đoạn âm thanh dài 8 giây do VALL-E sản sinh ra, rồi nhận định: khó có thể nhận ra đâu là con người phát biểu, đâu là AI phát ra âm thanh.

Mặc dù cách dùng từ của VALL-E vẫn chưa thực sự giống người, ông vẫn nhận định ông cảm thấy “đáng sợ”.

Đa số chúng ta đã quen với những cuộc gọi tự động, nơi một giọng nói được ghi âm sẵn hoặc một giọng nói tự động vang lên tại đầu dây bên kia. Với một hệ thống như VALL-E, giọng nói máy nay có thể đạt tới mức độ trau chuốt chưa từng có.

Và thật khó nhận xét tương lai có thể ra sao khi kẻ gian có thể lợi dụng một cuộc điện thoại để ghi âm giọng của bạn, rồi giả danh chính bạn đi lừa người khác. Càng đáng lo ngại khi các nhà nghiên cứu khẳng định họ có thể tái tạo cả “cảm xúc và môi trường âm thanh” chỉ với đoạn ghi âm dài 3 giây.

Các nhà nghiên cứu - những cha đẻ của hệ thống VALL-E cũng không có cách giải quyết sáng tạo nào, cho rằng cách thức tốt nhất hiện nay là xây dựng một hệ thống phát hiện giọng nói tạo ra bởi máy. Chúng ta cũng khó có thể thắc mắc tại sao họ lại làm thế, bởi lẽ trong ngành công nghệ, đa số sẽ trả lời "cứ làm được là làm thôi".


    Nguồn: /

    Dùng AI để tạo ra các loại bia có hương vị hấp dẫn hơn

    Các ngành công nghệ

    Trí tuệ nhân tạo (AI) đang ngày càng đóng vai trò quan trọng, hỗ trợ cho con người trong nhiều lĩnh vực khác nhau. Giờ đây, các nhà khoa học đang muốn nhờ AI để giúp tạo ra những loại bia ngon hơn.

    Trung Quốc tiến gần hơn chip lượng tử nhờ tạo ra nguồn sáng mới

    Các ngành công nghệ

    Các nhà nghiên cứu Trung Quốc sử dụng loại chất bán dẫn thông thường để tạo ra nguồn sáng lượng tử - thành phần quan trọng để chế tạo chip lượng tử.

    Robot thụ phấn 6 tay hoạt động trong nhà kính

    Các ngành công nghệ

    Nhờ có 6 cánh tay, robot Stickbug có thể thụ phấn cho nhiều bông hoa cùng lúc với tốc độ 1,5 lần thụ phấn mỗi phút.

    Tốc độ 6G trong thử nghiệm mới - nhanh hơn 500 lần so với 5G

    Các ngành công nghệ

    Một tập đoàn gồm các công ty ở Nhật Bản đã chế tạo thiết bị không dây 6G tốc độ cao đầu tiên trên thế giới.

    Robot hình người đa năng tự phát triển đầu tiên của Trung Quốc

    Các ngành công nghệ

    Robot hình người Tiangong cao 1,63 m và nặng 43 kg trình làng tại Khu phát triển kinh tế - công nghệ Bắc Kinh hôm 27/4.

    Tạo ra quần áo, túi xách có thể sạc điện thoại

    Các ngành công nghệ

    Các nhà khoa học Trung Quốc vừa giới thiệu loại túi xách và vải có thể sạc điện thoại vô cùng tiện lợi.

    AI phát hiện 3 bệnh ung thư nguy hiểm chỉ với một giọt máu khô

    Các ngành công nghệ

    Một công cụ mới, với sự trợ giúp của trí tuệ nhân tạo (AI), có thể phát hiện 3 loại ung thư nguy hiểm nhất trong vòng vài phút, chỉ cần một giọt máu khô.

    Các nhà khoa học Hàn Quốc phát triển phương pháp sản xuất nhanh kim cương trong 150 phút

    Các ngành công nghệ

    Các nhà khoa học phát triển quy trình sản xuất kim cương nhân tạo với kim loại lỏng ở mức nhiệt khoảng 1.000 độ C và áp suất thấp.

    Thiết bị sản xuất điện nhiệt hạch đạt nhiệt độ 37 triệu độ C

    Các ngành công nghệ

    FuZe là thiết bị nhỏ giá rẻ có thể đạt nhiệt độ năng lượng nhiệt hạch nhanh chóng và đáp ứng nhu cầu điện của con người trong tương lai.

    Google Maps sắp có tính năng mới siêu hữu ích, không còn lo đi lạc dù đi vào vùng mất sóng

    Các ngành công nghệ

    Với tính năng mới này, người dùng sẽ luôn biết vị trí của mình, không cần lo sợ đi lạc khi mất mạng di động hay đi vào những vùng mất sóng.