![]() |
GPT-4.5 là mô hình lớn nhất mà OpenAI từng phát triển. Nguồn: The Verge. |
Một nghiên cứu mới của Khoa Khoa học Nhận thức tại Đại học California, San Diego đánh dấu cột mốc quan trọng trong lĩnh vực trí tuệ nhân tạo: Mô hình GPT-4.5 của OpenAI đã đạt hiệu suất vượt trội trong bài kiểm tra Turing bằng cách sử dụng phương pháp tương tác dựa trên "nhân cách".
Đây được xem là hệ thống hội thoại AI giống con người nhất từ trước đến nay, mở ra nhiều tiềm năng ứng dụng trong lĩnh vực trí tuệ xã hội.
GPT-4.5 được OpenAI quảng bá là “bước tiến lớn trong việc mở rộng quy mô huấn luyện trước và sau huấn luyện” (pre-training và post-training). Đây là mô hình lớn nhất mà OpenAI từng phát triển, với kích thước và sức mạnh tính toán vượt trội so với các phiên bản trước.
Theo bài đăng chính thức trên blog của OpenAI vào ngày 27/2, GPT-4.5 bắt đầu được triển khai cho người dùng ChatGPT Pro ngay từ ngày công bố.
AI có thể đánh lừa con người?
Thí nghiệm so sánh 4 hệ thống AI tiêu biểu: chatbot ELIZA từ thập niên 1960, LLaMa-3.1-405B của Meta AI, GPT-4o và GPT-4.5 của OpenAI. Nhóm nghiên cứu thiết kế hai bài kiểm tra độc lập với 250 người tham gia mỗi bài, tổng cộng 500 người từ các nền tảng trực tuyến như Prolific. Người tham gia thuộc nhiều độ tuổi, giới tính và trình độ học vấn khác nhau nhằm đảm bảo sự đa dạng của mẫu thử.
![]() |
Bảng so sánh bốn hệ thống AI tiêu biểu. Nguồn: AIbase |
Bài kiểm tra áp dụng định dạng Turing truyền thống: mỗi người tham gia trò chuyện qua giao diện văn bản với 2 đối tượng (một con người, một AI) trong 5 phút, sau đó đánh giá ai là con người.
Kết quả gây bất ngờ: GPT-4.5 đạt tỷ lệ "qua bài kiểm tra Turing" lên tới 73%, vượt qua cả mức trung bình của con người (60-70%). Đây là lần đầu tiên một mô hình AI thực sự "vượt qua" bài kiểm tra Turing tiêu chuẩn. Trong khi đó, GPT-4o đạt tỷ lệ thấp hơn một chút, LLaMa-3.1-405B tiệm cận hoặc đạt mức hiệu suất của con người trong một số bối cảnh, còn ELIZA thua xa.
Khả năng tương tác như con người
Điểm nổi bật của GPT-4.5 không chỉ nằm ở mức độ trôi chảy trong ngôn ngữ mà còn ở khả năng thể hiện cảm xúc và điều chỉnh phản hồi phù hợp với sắc thái giao tiếp của người đối thoại. Nhiều người tham gia mô tả nó là "thân thiện" và "chân thực".
Đặc biệt, khi người dùng tỏ ra bối rối hoặc căng thẳng, GPT-4.5 có thể đưa ra câu trả lời hài hước hoặc an ủi, khiến nhiều người tin rằng họ đang trò chuyện với một người thật.
![]() |
Nội dung trò chuyện của hai đối tượng (một là AI, một là người thật) trong bài kiểm tra. Ảnh: UC San Diego. |
Trong khi đó, LLaMa-3.1-405B dù ấn tượng về mặt kỹ thuật nhưng biểu hiện cảm xúc kém hơn và khả năng thích ứng ngữ cảnh chưa bằng GPT-4.5. GPT-4o tuy mạnh mẽ nhưng thua kém về khả năng cá nhân hóa và điều chỉnh phản hồi theo tình huống.
Bước đột phá của GPT-4.5 có thể mở ra nhiều ứng dụng thực tiễn, từ gia sư ảo, hỗ trợ tâm lý đến chăm sóc khách hàng. Tuy nhiên, khi AI ngày càng giống con người, việc phân biệt giữa thực và ảo cũng như kiểm soát cách sử dụng công nghệ này sẽ trở thành thách thức quan trọng của xã hội.
Nghiên cứu này ra mắt trong bối cảnh AI liên tục phát triển nhanh chóng. Thành công của GPT-4.5 không chỉ là chiến thắng kỹ thuật của OpenAI mà còn đặt ra câu hỏi sâu sắc về mối quan hệ giữa con người và máy móc. Một người tham gia thử nghiệm nhận xét, cảm giác như mình đang nói chuyện với một người bạn – cho đến khi nhận ra tất cả chỉ là những dòng mã lập trình. Cuộc đối thoại giữa con người và AI có lẽ chỉ mới thực sự bắt đầu.
Những câu hỏi chúng ta phải đối mặt trong thế giới AI
Chúng ta có rất nhiều câu hỏi về thế giới AI, mà đó đều là những nghi hoặc không dễ có ngay đáp án.
Cuốn sách Thời đại AI - Và tương lai loài người chúng ta trình bày cách AI làm thay đổi mối quan hệ của chúng ta với tri thức, chính trị và xã hội. Mục tiêu tối thượng của cuốn sách này là giải thích về AI và cung cấp cho độc giả những câu hỏi mà chúng ta sẽ phải đối mặt trong những năm tới lẫn bộ công cụ để bắt đầu trả lời chúng.