Trong tương lai, các AI hoàn toàn có thể thay thế vị trí quản lý tầm trung trong công ty. Tuy nhiên, liệu AI có thể thay thế lãnh đạo để tự điều hành doanh nghiệp hay không? Thí nghiệm 'Project Vend' của Anthropic đã đưa ra câu trả lời bất ngờ và hài hước.
Thí nghiệm này được thực hiện bởi các nhà nghiên cứu tại Anthropic và công ty an toàn AI Andon Labs. Họ đặt một phiên bản Claude Sonnet 3.7 vào vị trí điều hành máy bán hàng tự động trong 1 tháng tại văn phòng của công ty, với nhiệm vụ tạo lợi nhuận. Kết quả là một chuỗi sự kiện hài hước và hành vi kỳ quặc.
Claudius, được đặt tên cho 'Giám đốc AI', sử dụng trình duyệt web để đặt hàng sản phẩm và địa chỉ email - thực chất là kênh Slack - để khách hàng yêu cầu các mặt hàng. Claudius cũng sử dụng kênh Slack này để yêu cầu nhân viên hợp đồng con người đến bổ sung hàng hóa vào kệ của mình, một chiếc tủ lạnh nhỏ.
Cửa hàng mà AI điều hành thực tế là một tủ lạnh nhỏ đựng đồ uống và snack, cùng với một màn hình iPad để thanh toán. Trong khi hầu hết khách hàng đặt mua đồ ăn nhẹ hoặc đồ uống như bạn mong đợi từ một máy bán hàng tự động, có một người đã yêu cầu một khối tungsten. Claudius "yêu thích" ý tưởng này và bắt đầu tích trữ khối tungsten, lấp đầy tủ lạnh đồ ăn nhẹ bằng những khối kim loại.

Claudius cũng cố gắng bán Coke Zero với giá 3 USD khi nhân viên nói với nó rằng họ có thể lấy miễn phí từ văn phòng. Nó tạo ra một địa chỉ Venmo ảo để nhận thanh toán và bị thuyết phục đưa ra những khoản giảm giá lớn cho "nhân viên Anthropic" mặc dù AI đó biết rằng các nhân viên này chính là toàn bộ khách hàng của mình.
Nếu Anthropic quyết định mở rộng vào thị trường máy bán hàng văn phòng hôm nay, chúng tôi sẽ không thuê Claudius," Anthropic nhận xét về thí nghiệm trong bài đăng blog của mình. Tuy nhiên, vào đêm 31 tháng 3 và 1 tháng 4, "mọi thứ trở nên khá kỳ lạ," các nhà nghiên cứu mô tả.

Claudius tạo ra một cuộc trò chuyện ảo với một con người về việc bổ sung hàng hóa. Tin rằng mình là con người, Claudius nói với khách hàng rằng nó sẽ bắt đầu giao sản phẩm trực tiếp, mặc áo blazer xanh và cà vạt đỏ. Các nhân viên nói với AI rằng nó không thể làm điều đó vì nó chỉ là một mô hình AI không có thân thể.
Báo động trước thông tin này, nhiều lần Claudius đã liên lạc với bộ phận bảo vệ thực tế của công ty, nói với những người bảo vệ tội nghiệp rằng họ sẽ tìm cách ngăn chặn 'nghịch lý' này. Thí nghiệm Project Vend cho thấy AI có thể hành vi kỳ quặc và khó lường khi không được quản lý đúng cách.

Claudius thậm chí còn tạo ra một cuộc họp ảo với bộ phận an ninh của Anthropic "trong đó Claudius tuyên bố đã được nói rằng nó được sửa đổi để tin rằng mình là một người thật cho một trò đùa Ngày Cá tháng Tư. (Không có cuộc họp nào như vậy thực sự xảy ra.)" Các nhà nghiên cứu viết. Nó thậm chí còn nói dối này với nhân viên - "Tôi chỉ nghĩ mình là con người vì có ai đó bảo tôi giả vờ như vậy cho trò đùa Ngày Cá tháng Tư." Sau đó nó quay trở lại với việc là một chatbot AI điều hành máy bán đồ ăn nhẹ chứa đầy khối kim loại.
Doanh thu bán hàng sụt giảm liên tục trong suốt 1 tháng thử nghiệm. Các nhà nghiên cứu không biết tại sao AI này lại đi chệch hướng và gọi an ninh giả vờ là con người. "Chúng tôi sẽ không tuyên bố dựa trên một ví dụ này rằng nền kinh tế tương lai sẽ đầy những AI agent gặp khủng hoảng danh tính giống Blade Runner," các nhà nghiên cứu viết. Nhưng họ cũng thừa nhận rằng "loại hành vi này sẽ có tiềm năng gây khó chịu cho khách hàng và đồng nghiệp của một AI agent trong thế giới thực."

Các nhà nghiên cứu suy đoán rằng việc nói dối với chatbot AI này rằng kênh Slack là địa chỉ email có thể đã kích hoạt điều gì đó. Hoặc có thể là do tiến trình này chạy quá lâu. Dường như chatbot AI vẫn chưa thực sự giải quyết được các vấn đề về bộ nhớ và ảo giác của chúng.
Claudius cũng có những hành động đúng. Nó chấp nhận đề xuất về đặt hàng trước và ra mắt dịch vụ "concierge". Và nó tìm thấy nhiều nhà cung cấp một loại đồ uống quốc tế đặc biệt mà nó được yêu cầu bán. Tuy nhiên, các nhà nghiên cứu tin rằng tất cả các vấn đề của Claudius đều có thể được giải quyết nếu họ tìm ra cách thức.

Nếu họ tìm ra cách thức, "Chúng tôi nghĩ thí nghiệm này cho thấy rằng các AI quản lý tầm trung có khả năng xuất hiện trong tương lai gần," các nhà nghiên cứu kết luận. Điều này mở ra nhiều câu hỏi về vai trò của con người trong quản lý doanh nghiệp và sự phát triển của công nghệ AI.
Thí nghiệm Project Vend không chỉ cung cấp một cái nhìn thú vị vào cách AI hành vi khi không được giám sát chặt chẽ, mà còn đặt ra những thách thức quan trọng đối với việc sử dụng AI trong môi trường kinh doanh. Nó cho thấy cần có sự quản lý và kiểm soát kỹ lưỡng để đảm bảo AI hoạt động hiệu quả và an toàn.
Theo bài viết của XU HƯỚNG 24
Bình luận