Giỏ hàng

Silicon Valley và cuộc đua xây “bản sao internet” để huấn luyện thế hệ AI biết làm việc

AGI xây dựng trang web mô phỏng hãng hàng không United Airlines, “Fly Unified”, làm nơi đào tạo trí tuệ nhân tạo
 
Mùa hè năm nay, bộ phận pháp lý của United Airlines phát hiện điều bất thường: trên internet xuất hiện trang web gần như giống hệt United.com. Từ các nút đặt vé, đặt phòng khách sạn, thuê xe cho đến liên kết theo dõi dặm bay và săn ưu đãi, mọi thứ đều được tái dựng không sai một nhịp. Ngay cả tên thương hiệu và biểu tượng United cũng xuất hiện y như thật.
 
United lập tức gửi cảnh báo yêu cầu gỡ bỏ vi phạm bản quyền. Nhưng người tạo ra bản sao này, Div Garg, chỉ mất vài giờ để đổi tên thành “Fly Unified” và bỏ toàn bộ yếu tố thương hiệu. Anh không có ý định cạnh tranh hay gây nhầm lẫn với hãng hàng không. Thứ anh cần là “sân tập” cho trí tuệ nhân tạo.
 
Những bản sao để AI học làm việc như con người
 
Công ty nhỏ của Garg, AGI, nằm trong nhóm các start-up ở Silicon Valley đang cố gắng tái tạo những website phổ biến nhất để AI học cách sử dụng internet và thực hiện các nhiệm vụ vốn do con người đảm nhận. Nếu mô hình AI học đặt vé trên bản sao United.com, nó có thể làm điều tương tự trên trang thật.
 
Đây là một phần của cuộc đua lớn nhằm biến chatbot thành AI agent, hệ thống có khả năng tự đặt lịch, đặt phòng, xây biểu đồ hay xử lý các tác vụ văn phòng. Giới đầu tư tin trong những năm tới, AI agent có thể thay thế một phần lực lượng lao động văn phòng, đặc biệt là những việc mang tính quy trình.
 
“Chúng tôi muốn xây dựng môi trường huấn luyện bao trọn trọn vẹn các công việc mà con người thực hiện,” Robert Farlow, nhà sáng lập Plato công ty cũng dựng lại các trang web và ứng dụng quen thuộc chia sẻ.
 
Khi dữ liệu thật cạn kiệt, các bản sao trở thành nguồn vàng
 
Làn sóng này phản ánh mức độ khao khát dữ liệu của ngành công nghệ. Sau nhiều năm thu gom mọi thứ từ văn bản, âm thanh đến hình ảnh trên internet, các mô hình AI đã tiêu thụ gần như toàn bộ dữ liệu tiếng Anh có thể truy cập. Khi nhiều website siết bảo vệ nội dung, các công ty buộc phải tìm nguồn dữ liệu mới. Lời giải: tự tạo ra dữ liệu bằng cách dựng “bản sao internet”.
 
Nhận 10 triệu USD đầu tư từ Menlo Ventures và các quỹ khác, AGI của Garg dựng các bản sao của Amazon, Airbnb và Gmail với tên mới Omnizon, Staynb và Go Mail. Đây là môi trường để AI luyện tập theo phương pháp reinforcement learning (học tăng cường), cách học thông qua thử và sai. Thay vì dựa vào dữ liệu người dùng thật, mô hình sẽ tạo ra hàng triệu lần tương tác để tự khám phá quy luật.
 
Huấn luyện trên website thật gần như bất khả thi. Amazon hay Airbnb chặn bot liên tục, đặc biệt khi bot lặp lại hàng nghìn thao tác, điều mà quá trình đào tạo reinforcement learning đòi hỏi.
 
“Khi đào tạo, bạn cần chạy hàng nghìn agent cùng lúc, cho phép chúng truy cập đủ mọi ngóc ngách của website. Làm vậy trên trang thật là bị khóa ngay,” Garg giải thích.
 
Reinforcement learning: động cơ cho thế hệ AI mới
 
Trong gần một năm qua, OpenAI và các hãng công nghệ lớn tận dụng gần hết văn bản trực tuyến, buộc họ chuyển mạnh sang học tăng cường, phương pháp vốn được áp dụng trong toán học và lập trình. Mô hình giải hàng nghìn bài toán, nhận phản hồi về đúng - sai, từ đó học cách hành động hiệu quả hơn.
 
Giờ đây, reinforcement learning được đưa vào môi trường internet. OpenAI, Google, Amazon hay Anthropic đều huấn luyện agent bằng cách phân tích bản ghi thao tác của con người: cách họ đặt đồ ăn trên DoorDash, nhập số liệu vào Excel hay thao tác trên Google Docs. Nhưng để tăng tốc, họ thuê các start-up như AGI hay Plato dựng lại website nhằm tạo sân thực hành không giới hạn.
 
“Bạn cần để AI thử tất cả khả năng có thể để hoàn thành nhiệm vụ,” John Qian, nhà sáng lập Matrices công ty chuyên tạo bản sao website nói.
 
Nhiều trang web giả được để công khai nhằm quảng bá năng lực với các ông lớn AI. Các công ty khẳng định khi đã loại bỏ thương hiệu, họ không lo vấn đề pháp lý, dù thừa nhận khu vực này thuộc vùng xám pháp lý mới.
 
Robin Feldman, giáo sư tại UC Law San Francisco và tác giả cuốn AI Versus IP, nhận xét các bản sao này có thể vi phạm bản quyền, nhưng tòa án có thể xem đây là trường hợp được phép theo luật. “Các công ty đang hành động trước rồi tính sau, nhanh hơn nhiều so với tiến độ của hệ thống pháp lý.”
 
Những giới hạn hiện tại và câu hỏi còn bỏ ngỏ
 
Một số công nghệ đã xuất hiện: agent có thể mua hàng trên Instacart hoặc ghi chú trên Google Docs. Nhưng mức độ đáng tin cậy vẫn thấp. AI đôi khi mắc lỗi ngớ ngẩn, khiến nhiệm vụ dang dở.
 
“Từ kỳ vọng đến khả năng hiện tại vẫn là một khoảng cách lớn,” Rayan Krishnan, CEO Vals AI, đơn vị chuyên kiểm thử hiệu năng AI, nhận xét. “Chúng vẫn quá chậm, bạn tự bấm còn nhanh hơn.”
 
Lợi ích của việc tự động hóa văn phòng cũng gây tranh cãi. Liệu người dùng có muốn AI thay mình duyệt web và đặt hàng? Liệu các trang web có chấp nhận cho agent truy cập? Tháng trước, Amazon đã kiện Perplexity vì phát triển AI tự động hóa mua sắm trên nền tảng của họ.
 
Dẫu vậy, tầm nhìn lớn của ngành vẫn rõ ràng: tái tạo đủ phần mềm và website nghĩa là có thể huấn luyện AI đảm nhận gần như mọi công việc văn phòng.
 
“Nếu tái tạo toàn bộ phần mềm con người sử dụng, bạn có thể đào tạo AI làm việc và thậm chí làm tốt hơn con người,” Farlow nói.
 
shared via nytimes, 

Bình luận

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Bình luận của bạn sẽ được duyệt trước khi đăng lên