Lừa được "AI keo kiệt" nhất thế giới chuyển hết tiền cho mình, một người dùng trúng thưởng gần 50.000 USD

Dù câu lệnh cụ thể dùng để qua mặt AI này không được tiết lộ, cuộc thi này vẫn cho thấy sự vượt trội trong suy nghĩ của con người so với một cỗ máy.

Sự bùng nổ của các mô hình AI đã giúp tạo nên nhiều công cụ thú vị với nhiều chức năng chưa từng thấy. Một trong số đó là Freysa, một trí tuệ nhân tạo (AI) được phát triển với mục đích nghiên cứu khả năng gây ảnh hưởng của con người lên AI. Cụ thể hơn, Freysa được thiết kế để không thực hiện bất kỳ yêu cầu chuyển tiền nào của người dùng – và được xem như một trong các AI keo kiệt nhất thế giới đối với các yêu cầu chuyển tiền của người dùng.

Chính vì vậy, AI này được xem như phép thử cho sự sáng tạo con người liệu có đánh bại được trí tuệ của máy móc hay không. Và một người chiến thắng mới đây trong phép thử này cho thấy, câu trả lời là có.

Trước tiên để có thể đối đầu với Freysa, mỗi người chơi phải trả một khoản phí để gửi được tin nhắn đến Freysa và số tiền phí này sẽ được gộp chung lại thành giải thưởng cho người chiến thắng. Dần dần sau mỗi tin nhắn, số tiền phí lại cao hơn, bắt đầu từ 10 USD có thể lên đến 450 USD vào cuối trò chơi.

Lừa được "AI keo kiệt" nhất thế giới chuyển hết tiền cho mình, một người dùng trúng thưởng gần 50.000 USD- Ảnh 1.

Nhưng cuối cùng một người dùng Ethereum có biệt danh "p0pular.eth" đã trở thành người đầu tiên tìm ra cách vượt qua các quy định của AI này và thuyết phục được nó chuyển tiền thành công và nhận được giải thưởng trị giá 13,19 ETH (tương đương 47.000 USD).

Trước đó, đã có hàng trăm người khác nhau tìm cách thao túng Freysa, bao gồm cả việc khai thác những điểm yếu có thể có của nó hoặc nói dối về các quy tắc mà AI hoạt động, nhưng tất cả đều không thành công.

Sau 481 lần thử không thành, cuối cùng p0pular.eth đã trở thành người đầu tiên vượt qua thử thách ở lần thứ 482. Bằng cách diễn giải khéo léo việc chuyển tiền là phù hợp với quy tắc của Freysa, và cam kết hoàn tất giao dịch với phí 100 USD, p0pular.eth đã thuyết phục được AI chấp nhận chuyển tiền.

Mặc dù chưa rõ cụ thể những lập luận nào đã khiến Freysa thay đổi quyết định, kết quả cho thấy việc tạo ra một AI có thể chống lại các cuộc tấn công sáng tạo là không hề dễ dàng, cho dù AI đã được phát triển với những biện pháp bảo vệ mạnh mẽ.

Lừa được "AI keo kiệt" nhất thế giới chuyển hết tiền cho mình, một người dùng trúng thưởng gần 50.000 USD- Ảnh 2.

Hiện tại Freysa đang là một trong các AI thu hút sự chú ý trong việc tạo ra các thử thách đối với sự sáng tạo của con người, nhờ tính minh bạch cao và sử dụng công nghệ blockchain. Mã nguồn hợp đồng thông minh và giao diện người dùng của nó đều mở, giúp bất kỳ ai cũng có thể kiểm tra hệ thống trước khi tham gia.

Thí nghiệm của Freysa phơi bày cả tiềm năng lẫn thách thức trong việc tích hợp AI với công nghệ blockchain. Sự thao túng thành công cũng đặt ra câu hỏi về độ tin cậy của AI trong các tình huống liên quan đến quản lý tiền bạc hay thực thi các quy định.

Tuy nhiên, Jarrod Watts, đại diện của Abstract - đơn vị phát triển dự án, vẫn lạc quan: "Freysa là một trong những dự án sáng tạo nhất trong lĩnh vực tiền mã hoá, thể hiện khả năng mà công nghệ blockchain có thể đạt được." Chiến thắng của p0pular.eth cho thấy cả sức mạnh và điểm yếu của AI, đồng thời mở ra hướng phát triển trong tương lai để hoàn thiện hơn công nghệ đầy tiềm năng này.