Theo The Verge, ByteDance đang phát triển dự án trí tuệ nhân tạo Project Seed, gồm hai sản phẩm chính là Doubao – chatbot AI dành cho thị trường Trung Quốc, và một AI khác để thương mại hóa trên toàn cầu thông qua nền tảng đám mây. Cách phân bổ này tương tự khi họ phát hành ứng dụng video ngắn Douyin và TikTok.

Tuy nhiên, thay vì sử dụng công cụ huấn luyện AI theo mô hình ngôn ngữ lớn (LLM) của riêng mình, ByteDance được cho là dùng giao diện lập trình ứng dụng (API) của ChatGPT, vi phạm quy định trong ngành trí tuệ nhân tạo. Cả OpenAI và Microsoft đều có các điều khoản về việc đối tác không được sử dụng API ChatGPT để xây dựng các mô hình AI cạnh tranh với chính sản phẩm của hãng.

Logo TikTok hiển thị trên một màn hình điện thoại được chụp hồi tháng 8/2022. Ảnh: Reuters

Logo TikTok hiển thị trên một màn hình điện thoại. Ảnh: Reuters

Cũng theo nguồn tin, ByteDance lạm dụng công cụ của OpenAI trong nhiều giai đoạn phát triển Project Seed, gồm công đoạn đào tạo và đánh giá mô hình AI. Tuy nhiên, khi cần xin cấp phép hoạt động chatbot Doubao tại Trung Quốc vài tháng trước, ByteDance yêu cầu nhóm nghiên cứu dừng sử dụng API ChatGPT để tránh rắc rối pháp lý. “Họ nói cần đảm bảo mọi thứ đều hợp pháp”, nguồn tin nội bộ của The Verge cho biết.

Phản hồi về vấn đề, Jodi Seth, đại diện ByteDance, xác nhận công ty có dùng API ChatGPT trong giai đoạn khởi động Project Seed, nhưng đã ngừng hoàn toàn và xóa mọi dữ liệu đào tạo có liên quan từ giữa năm.

“Công ty được Microsoft cấp phép truy cập giao diện lập trình ứng dụng ChatGPT. Ngoài ra, ByteDance chỉ sử dụng công cụ này để hỗ trợ sản phẩm AI ở thị trường quốc tế. Với chatbot Doubao tại Trung Quốc, chúng tôi có các mô hình tự phát triển”, Seth nói.

Frank Shaw, đại diện Microsoft, cho biết công ty ý thức được nguy cơ vi phạm từ đối tác, do đó có sẵn quy trình nhằm phát hiện hành vi sử dụng sai mục đích. “Dịch vụ Azure OpenAI nằm trong khung truy cập hạn chế. Đồng nghĩa, đối tác phải tiến hành đăng ký và chờ phê duyệt. Microsoft cũng đặt ra các tiêu chuẩn để mọi người sử dụng công cụ API một cách có trách nhiệm”, Shaw nói.

Ngày 15/12, phía OpenAI đã dừng các tài khoản của ByteDance để tiến hành điều tra. Nếu phát hiện hành vi vi phạm chính sách, họ sẽ yêu cầu công ty mẹ của TikTok thực hiện những thay đổi cần thiết hoặc chấm dứt vĩnh viễn dịch vụ.

Theo The Verge, Project Seed khởi động khoảng một năm trước và nhận được sự ưu tiên từ lãnh đạo ByteDance. Mục tiêu của dự án là tạo một mô hình AI mạnh mẽ trong thời gian tối thiểu. Dự kiến, AI này đạt 200 tỷ tham số vào cuối năm 2023, vượt qua mốc 175 tỷ của GPT-3.5, đồng thời đuổi kịp GPT-4 vào năm 2024. Tuy nhiên, các chuyên gia đánh giá sự vội vàng của ByteDance có thể mang đến những tác động trái ngược.

Hoàng Giang