VinBigdata (đơn vị thuộc Tập đoàn Vingroup) cho biết, ứng dụng tập trung vào một số nội dung như pháp luật, lịch sử, văn hóa, danh nhân, danh lam thắng cảnh, đặc trưng vùng miền… Người dùng có thể sử dụng phiên bản trải nghiệm giới hạn của ViGPT bằng tiếng Việt trên giao diện website, tương tự như với ChatGPT. Cùng với phiên bản dành cho người dùng cuối, ViGPT sẽ ra mắt phiên bản dành cho doanh nghiệp, tích hợp trong nền tảng trí tuệ nhân tạo đa nhận thức VinBase 2.0. Đơn vị kỳ vọng ứng dụng góp phần thay đổi thói quen vận hành và tăng hiệu quả kinh doanh, marketing, dịch vụ khách hàng, quản trị rủi ro.
ViGPT dùng mô hình AI tạo sinh với điểm khác biệt là hướng đến người dùng cuối. Hiện nay, các đơn vị nghiên cứu và phát triển AI tạo sinh trên thế giới thường cung cấp sản phẩm theo một số hình thức như mã nguồn mở (open source), mã nguồn đóng (closed source) hoặc mã nguồn đóng nhưng có sẵn qua API (APIs) và ứng dụng cho người dùng cuối (application).
Với các mã nguồn mở như LLaMA (Meta), mô hình được công khai để các nhà phát triển, cộng đồng có thể tải xuống sử dụng, chỉnh sửa và tùy biến. Ngược lại, các mã nguồn đóng thường không công khai hoặc cung cấp qua giao thức kết nối (APIs) như GPT-4 (OpenAI) cho phép doanh nghiệp tích hợp phần lõi công nghệ này vào sản phẩm riêng. Ứng dụng như ChatGPT hay Bard là sản phẩm được hoàn thiện cho người dùng cuối có thể dễ dàng truy cập, cài đặt và sử dụng luôn các tác vụ cụ thể. “Đến nay, chưa có ứng dụng 100% made in Vietnam cho người dùng cuối chính thức công bố tại thị trường Việt Nam”, đại diện đơn vị cho biết.
Đại diện VinBigdata phân tích thêm, AI tạo sinh (Generative AI) được coi là thế hệ tiếp theo của trí tuệ nhân tạo, tập trung vào việc tạo ra nội dung, giải pháp hoặc ý tưởng mới, thay vì chỉ phân tích dữ liệu như hiện tại. Mô hình cơ bản đằng sau hoạt động của AI tạo sinh được gọi là mô hình ngôn ngữ lớn (Large Language Model hay LLM).
Đây là một loại mô hình ngôn ngữ được đào tạo bằng cách sử dụng các kỹ thuật học sâu trên tập dữ liệu văn bản khổng lồ. Các mô hình này có khả năng tạo văn bản tương tự như con người và thực hiện nhiều tác vụ xử lý ngôn ngữ tự nhiên. Một số mô hình phổ biến có thể kể đến như GPT-4 do OpenAI phát triển, hay Bard của Google.
Để làm chủ AI tạo sinh hoàn toàn từ tầng lõi sâu nhất, các doanh nghiệp cần xây dựng và huấn luyện mô hình ngôn ngữ lớn từ những bước sơ khai. Như với ViGPT, ở giai đoạn nền tảng, mô hình có thể được đào tạo trên tập dữ liệu lớn để ghi nhớ các quy luật và cấu trúc ngôn ngữ. Qua giai đoạn đào tạo, mô hình bắt đầu rút ra mối quan hệ giữa các từ, cụm từ, câu và các khái niệm khác nhau và sau đó tiếp tục được tinh chỉnh qua nhiều bước để tạo ra nền tảng phát triển các ứng dụng thực tế của AI tạo sinh.
Một điểm khác về bối cảnh thị trường, Bộ Thông tin và Truyền thông mới đây cũng ban hành kế hoạch, đặt mục tiêu đến năm 2025, Việt Nam có ít nhất một nền tảng công nghệ LLM tiếng Việt. Kế hoạch nhấn mạnh việc nghiên cứu, phát triển, đưa vào ứng dụng LLM tiếng Việt là một nhiệm vụ quan trọng, cần thiết và ý nghĩa. LLM tiếng Việt sử dụng tri thức, dữ liệu đào tạo đã được sàng lọc của Việt Nam, với chi phí thấp cho người dân, doanh nghiệp, tổ chức tại Việt Nam sử dụng để phát triển các ứng dụng mới.
Việt Nam đang ở những bước đầu trên hành trình chinh phục AI tạo sinh. Từ đó, đại diện VinBigdata cho biết sự ra đời của ViGPT góp phần thể hiện nỗ lực của các đơn vị công nghệ trong nước nhằm xóa bỏ sự phụ thuộc vào những sản phẩm quốc tế, đảm bảo tính chính xác của thông tin.
Minh Huy