
Sau một buổi sáng dành thời gian xem xét dữ liệu, đọc các bài nghiên cứu và thử nghiệm những mô hình AI tiên tiến nhất trong căn hộ ở Manhattan, Edwin Chen rời nhà, đi bộ tới cửa hàng Starbucks Reserve Roastery sang trọng trên Đại lộ 9.
Mặc áo phông xanh navy của Vuori và khoác túi vải có hình hổ, Chen đi xuống tầng hầm, chọn một góc bàn tối và gọi một tách trà xanh nhỏ - “vì gọi cà phê ở đây tốn quá nhiều thời gian”, anh nói.
Người sáng lập kiêm CEO của Surge AI, công ty chuyên gắn nhãn dữ liệu và huấn luyện trí tuệ nhân tạo, bắt đầu một cuộc trò chuyện kéo dài hai tiếng không ngừng nghỉ về mọi chủ đề - từ văn hoá Thung lũng Silicon (anh “ghét nó”) đến các đối thủ (“họ chỉ là những xưởng lao động hạng hai”) cho tới việc loài người có thể giao tiếp với người ngoài hành tinh ra sao. “Họ đâu nói tiếng Anh — vậy ta sẽ giao tiếp thế nào? Làm sao giải mã được ngôn ngữ của họ? Hy vọng có cách nào đó dựa vào toán học”.
Câu hỏi này cũng xuất hiện trong truyện ngắn yêu thích của anh - “Story of Your Life” của Ted Chiang, được chuyển thể thành phim Arrival (Cuộc đổ bộ). Trong đó, một nhà ngôn ngữ học nữ cố gắng giao tiếp với người ngoài hành tinh bằng cách tìm quy luật trong lời nói và chữ viết của họ. Chen nói rằng câu chuyện này chính là nguồn cảm hứng để anh thành lập Surge vào năm 2020 — một công ty gắn nhãn dữ liệu mà anh kỳ vọng sẽ “mã hóa được sự phong phú của nhân loại”.
Với anh, điều đó có nghĩa là tuyển những bộ óc xuất sắc nhất - bao gồm giáo sư từ Stanford, Princeton và Harvard - để huấn luyện AI, truyền tải tri thức của họ thành các chuỗi số 1 và 0 làm nền tảng cho các mô hình ngôn ngữ lớn (LLMs). Bên cạnh đó, Surge còn sử dụng hơn 1 triệu lao động tự do tại 50 quốc gia, những người đưa ra câu hỏi đánh đố AI, chấm điểm câu trả lời, và viết tiêu chí giúp AI học cách phản hồi chính xác hơn.
“Tôi thật sự tin rằng những gì chúng tôi đang làm là nền tảng thiết yếu cho mọi mô hình AI. Không có chúng tôi, AGI (trí tuệ nhân tạo tổng quát) sẽ không bao giờ thành hiện thực. Và tôi muốn điều đó xảy ra”, Edwin Chen nói.
TỪ NGƯỜI VÔ DANH THÀNH TỶ PHÚ AI
Thông minh, nói nhiều và có phần lập dị, Chen có lẽ là doanh nhân công nghệ thành công nhất mà bạn chưa từng nghe tên.
Từng làm việc tại Twitter, Google và Facebook, Chen rời Thung lũng Silicon cách đây bảy năm, tự dùng “vài triệu USD tiết kiệm” để lập công ty. Anh không nhận vốn đầu tư mạo hiểm, vì “ghét trò chơi địa vị của Silicon Valley”.
“Tôi cho rằng các startup ở đó phần lớn chỉ là kế hoạch làm giàu nhanh”, Chen nói. “Một khi huy động quá nhiều tiền, họ phải tiêu nó bằng mọi cách — thường là thuê người quá đà”.
Surge AI giúp các công ty công nghệ thu thập và gắn nhãn dữ liệu chất lượng cao để huấn luyện mô hình AI.
Chỉ 5 năm sau khi ra đời, Surge đã đạt doanh thu 1,2 tỷ USD (năm 2024), với khách hàng gồm Google, Meta, Microsoft, Anthropic và Mistral - những tên tuổi đứng sau các mô hình như Gemini và Claude. Công ty có lãi từ năm đầu tiên, và hiện được định giá khoảng 24 tỷ USD. Surge đang đàm phán để huy động thêm 1 tỷ USD ở mức định giá 30 tỷ USD.
Với khoảng 75% cổ phần, Edwin Chen sở hữu khối tài sản 18 tỷ USD, đưa anh trở thành tân binh trẻ nhất (37 tuổi) trong danh sách Forbes 400 những người giàu nhất nước Mỹ năm nay.
Khác với mô hình gắn nhãn dữ liệu truyền thống, nơi lao động ở các nước nghèo được trả vài xu để phân loại ảnh “mèo” hay “chó”, Surge chọn hướng đi khác. Chen tuyển giáo sư, nhà nghiên cứu, chuyên gia chuyên ngành — những người được hướng dẫn để tương tác trực tiếp với chatbot, tìm cách “bẫy” chúng nói sai hoặc viết lại phản hồi tốt hơn.

Các cộng tác viên này cũng so sánh nhiều câu trả lời của AI cho cùng một câu hỏi, rồi giải thích vì sao câu này hay hơn.
“Chúng tôi đánh giá cao sự sáng tạo”, Chen nói. Trong phỏng vấn tuyển dụng, anh có thể hỏi ứng viên về ngôn ngữ học hoặc văn học David Foster Wallace, thay vì yêu cầu họ viết code.
Khoảng 20% nhân sự của Surge đến từ các lĩnh vực phi truyền thống — nghệ thuật, âm nhạc, khoa học xã hội.
Một ví dụ là Scott Heiner, cựu quản lý tour nhạc indie, người được Chen tuyển làm nhân viên thứ 5 sau khi gửi anh một bài luận của David Foster Wallace. “Anh ấy là kiểu người suy nghĩ hoàn toàn khác”, Heiner nhận xét.
ĐẾ CHẾ DỮ LIỆU THẦM LẶNG
Chen lớn lên tại Crystal River, Florida, trong một gia đình điều hành quán ăn Peking Garden. Từ nhỏ, anh đam mê ngôn ngữ và toán học, luôn muốn học “20 thứ tiếng”. Anh từng học trường nội trú Choate (nơi có cựu học sinh John F. Kennedy), sau đó vào MIT, nơi anh sáng lập câu lạc bộ ngôn ngữ học và thực hành ngủ đa pha (ngủ ngắn nhiều lần trong ngày).
Sau ba năm, Chen nghỉ học khi đang thực tập tại quỹ đầu cơ của Peter Thiel, rồi nhận bằng hai năm sau.
Anh làm việc ở Google, Twitter, Facebook, nơi anh nhận ra cùng một vấn đề: Dữ liệu gắn nhãn kém chất lượng.
Năm 2020, Chen nghỉ việc tại Twitter và thành lập Surge.
“Tôi đã xây dựng các phiên bản sớm của hệ thống này suốt 10 năm qua”, anh nói.
Surge hiện có 250 nhân viên, chỉ bằng 1/4 quy mô của Scale AI, nhưng doanh thu lại cao hơn.
Chen cho biết anh từng “phát chán” với việc gắn nhãn dữ liệu rác từ những người không hiểu ngữ cảnh.
Surge chọn người có kiến thức ngữ cảnh sâu, hiểu văn hóa và chính trị. Nhờ đó, khi Google Gemini gặp khủng hoảng hồi tháng 5/2023, các nhà nghiên cứu của Google đã gọi Chen vào đêm thứ bảy. Cuộc gọi kéo dài hơn hai giờ - sau đó Google ký hợp đồng trị giá hơn 100 triệu USD mỗi năm với Surge.
“Bạn cảm nhận rõ mình đang trả tiền cho chất lượng - chứ không phải cho số giờ lao động”, một nhà nghiên cứu nói.
Surge giữ bí mật tuyệt đối. Ngay cả khách hàng cũng không biết chính xác cách Surge tuyển người hay gắn nhãn dữ liệu ra sao.
Các cộng tác viên được tuyển thông qua DataAnnotation Tech, công ty con của Surge, và được trả từ 20 USD/giờ, có thể lên tới 40 USD/giờ cho các nhiệm vụ đặc biệt.
Chen nói Surge có hệ thống kiểm tra ẩn, đánh giá chéo giữa các nhóm annotator và dùng AI để giám sát năng suất.
“Chúng tôi không cố giấu, chỉ là quá bận để nói về công việc”, anh nói.
TỶ PHÚ LẬP DỊ
Chen là người thuần chay, đi bộ hơn 20.000 bước mỗi ngày, thường tản bộ lên Quảng trường Thời Đại lúc nửa đêm để “quan sát một mô hình thu nhỏ của nhân loại”.
Chen khẳng định anh không muốn đưa Surge lên sàn: “Tại sao lại phải niêm yết công khai? Các công ty đại chúng luôn bị ám ảnh bởi lợi nhuận ngắn hạn”. Không PR, không quảng cáo, không VC — Edwin Chen đã lặng lẽ xây dựng đế chế dữ liệu phía sau làn sóng AI, cung cấp “nhiên liệu” cho các mô hình mạnh nhất thế giới.
Trong khi Thung lũng Silicon đua nhau đốt hàng tỷ USD cho hứa hẹn “trí tuệ nhân tạo tổng quát”, Chen tin rằng: “AGI sẽ không bao giờ xảy ra nếu không có dữ liệu do con người tạo ra - được hiểu đúng, được gắn nhãn đúng, và được nuôi dưỡng bằng trí tuệ thực sự của nhân loại”.
Và đó là điều mà Surge và Edwin Chen đang âm thầm làm nên.
Theo: Forbes