Kể từ khi ChatGPT ra mắt cho đến nay, chủ đề AI tạo sinh đã thu hút sự chú ý trên toàn cầu với sự tham gia của hàng loạt người khổng lồ công nghệ trên toàn cầu. Đây cũng chính là chủ đề trọng tâm trong sự kiện AI Day 2023 – hội nghị khoa học thường niên về trí tuệ nhân tạo – mới khai mạc ngày 5-12 vừa qua tại Thành phố Hồ Chí Minh.
Sự kiện này cũng là nơi Công ty VinAI giới thiệu dự án thú vị của mình có tên "PhởGPT", một mô hình ngôn ngữ lớn mã nguồn mở tối ưu cho ngôn ngữ tiếng Việt. Trong khi các chatbot AI hay các dịch vụ tạo sinh hình ảnh mới là thứ gần gũi với người dùng phổ thông, các mô hình ngôn ngữ lớn bên dưới mới là công nghệ nền tảng làm nên các ứng dụng thú vị này. Đây cũng chính là loại công nghệ mà những người khổng lồ trên thế giới đang chạy đua phát triển, với các cái tên như OpenAI, Microsoft, Google, Meta, Baidu, …
Vậy PhởGPT có gì khác biệt so với các mô hình ngôn ngữ lớn đã ra mắt trên thị trường? Trong cuộc trò chuyện của chúng tôi với ông Bùi Hải Hưng, Tổng giám đốc VinAI, đã tiết lộ nhiều điểm độc đáo trong mô hình ngôn ngữ lớn thuần Việt này.
Dự án này có 2 điểm rất đặc biệt:
Đầu tiên đó là mô hình này được phát triển từ đầu, hoàn toàn độc lập với các mô hình ngôn ngữ khác trên thế giới. Nghĩa là thay vì lấy một mô hình ngôn ngữ lớn có sẵn, tinh chỉnh lại nó và biến nó thành của mình, VinAI đã tự xây dựng PhởGPT từ đầu. Do vậy, đội ngũ nghiên cứu của VinAI có thể dùng nhiều cách khác nhau để tối ưu mô hình này cho ngôn ngữ tiếng Việt – một điều rất khó thực hiện được nếu chỉ lấy một mô hình của nước ngoài và tinh chỉnh lại theo ngôn ngữ tiếng Việt.
Với mô hình ngôn ngữ dữ liệu lớn có 7.5 tỷ tham số, được xây dựng trên nền tảng giải mã Transformer. Được huấn luyện từ đầu, mô hình này sử dụng những kỹ thuật tiên tiến nhất hiện có (như cơ chế tập trung chớp nhoáng (Flash Attention), ngoại suy độ dài ngữ cảnh AliBi). Những kỹ thuật này không chỉ giúp mô hình hiểu sâu hơn về ngữ cảnh mà còn làm tăng khả năng đối thoại và tương tác tự nhiên của PhởGPT. Điều này giúp mô hình trở thành một công cụ đa nhiệm và linh hoạt, có khả năng đáp ứng đa dạng các nhu cầu ngôn ngữ của người sử dụng.
Điểm đặc biệt thứ hai của PhởGPT là một dự án mã nguồn mở - khác với mô hình mã nguồn đóng như GPT-4 (mô hình nền tảng cho ChatGPT). Việc công khai mã nguồn PhởGPT và sẵn sàng cung cấp cho mọi người, giúp tạo ra một môi trường, cộng đồng người dùng có thể phát triển các ứng dụng tùy chỉnh và độc đáo, đặc biệt là những ứng dụng đòi hỏi sự bảo mật cao mà không phụ thuộc vào nguồn từ các phần mềm sở hữu riêng.
Cách tiếp cận này cũng là một trào lưu trên thế giới và đang được các hãng lớn như Meta áp dụng khi ra mắt mô hình Llama vài tháng trước.
Một yếu tố khác cần chú ý là việc xây dựng mô hình ngôn ngữ lớn này được thực hiện trong bối cảnh khan hiếm nguồn cung chip AI trên toàn cầu. Điều này cũng hướng VinAI đến mục tiêu tiếp theo trong quá trình xây dựng PhởGPT: đó là tối ưu việc sử dụng phần cứng khi tính toán các tác vụ AI. Việc tối ưu hóa này nhằm giúp tạo ra một mô hình nhỏ gọn nhưng vẫn hiệu quả trong vận hành ứng dụng, đồng thời tiết kiệm chi phí vận hành và tính toán.
Đây là một hướng đi có ý nghĩa rất quan trọng, không chỉ đối với các doanh nghiệp Việt Nam mà còn của nhiều nước khác trong khu vực khi hầu hết đều đang khó tiếp cận được nguồn cung chip AI cũng như chi phí phát triển các mô hình tính toán và chi phí vận hành đều là những gánh nặng và thách thức lớn. Do vậy, nếu có thể tối ưu các mô hình ngôn ngữ để tiết kiệm chi phí sẽ giúp doanh nghiệp trong khu vực vượt qua được các trở ngại về chi phí, giá thành để bắt kịp các trào lưu trong khu vực.
PhởGPT là một nỗ lực rất đáng ghi nhận vì chỉ trong vòng một năm sau khi ChatGPT và trào lưu AI tạo sinh trở nên bùng nổ trên toàn cầu, VinAI đã tự xây dựng được cho mình một mô hình ngôn ngữ lớn. Việc VinAI nghiên cứu và phát triển, công bố PhởGPT hôm nay, sẽ đặt những nền móng đầu tiên cho sự phát triển các mô hình ngôn ngữ tiếng Việt hiệu suất cao, làm cơ sở để phát triển các ứng dụng thực tế, hiêụ quả, phù hợp với chiến lược phát triển AI đến năm 2030 của Chính phủ.