Được phát triển bởi các kỹ sư Zalo, mô hình ngôn ngữ lớn với 13 tỷ tham số là thành quả của công nghệ AI Việt, mang tới nhiều ứng dụng thực tiễn, thu hút đông đảo người dùng truy cập mỗi tháng
- Vi sinh vật – Người bạn bị lãng quên trong cuộc chiến kháng sinh
- AI thay thế con người – Trường học nên dạy gì để không tụt hậu?
- Vi khuẩn ăn PFAS: Phát hiện mới giúp ngăn chất gây ung thư
Loạt ứng dụng từ mô hình công nghệ AI Việt đạt hàng triệu lượt sử dụng
Được phát triển bởi các kỹ sư Zalo, mô hình ngôn ngữ lớn với 13 tỷ tham số đã cho ra đời nhiều ứng dụng thực tiễn, thu hút đông đảo người dùng truy cập mỗi tháng. Nổi bật là Trợ lý hỏi đáp tổng hợp Kiki Info, vận hành dưới dạng Official Account (OA) trên nền tảng Zalo. Ứng dụng này cung cấp 3 nhóm tính năng chính gồm:
- Hỏi đáp đa lĩnh vực như khoa học, lịch sử, luật giao thông…
- Sáng tạo nội dung: hỗ trợ viết văn, soạn email, tin bài mạng xã hội…
- Giải trí: gợi ý điểm du lịch, âm nhạc, sách hay…
Chỉ sau gần 2 tháng triển khai, Kiki Info đã đạt hơn 1 triệu lượt người dùng truy cập vào tài khoản OA trên Zalo.
Bên cạnh đó, ứng dụng Thiệp AI của Zalo cũng gây ấn tượng khi đạt mốc 15 triệu thiệp được người dùng tạo và gửi đi trong vòng 2 tháng. Công cụ này giúp người dùng dễ dàng gửi lời chúc tới bạn bè, người thân trong các dịp lễ, Tết.
Những ứng dụng này được đánh giá cao nhờ mang lại trải nghiệm thông minh, rút ngắn thời gian tìm kiếm thông tin và hỗ trợ người dùng kết nối, gắn kết các mối quan hệ một cách thú vị hơn.

Mô hình LLM Việt vươn Top 2 bảng xếp hạng năng lực tiếng Việt
Mô hình LLM của Zalo được phát triển hoàn toàn từ đầu, kiểm soát toàn bộ quy trình từ khởi tạo tham số, quyết định kiến trúc đến thuật toán huấn luyện trên tập dữ liệu tiếng Việt. Thành tựu này giúp đội ngũ kỹ sư Việt làm chủ công nghệ, đảm bảo chất lượng huấn luyện.
Cuối năm 2024, mô hình LLM của Zalo đạt Top 2 trên bảng xếp hạng VMLU – nền tảng đánh giá năng lực tiếng Việt của các LLM, chỉ đứng sau Llama-3-70B của Meta, và vượt qua nhiều tên tuổi lớn như GPT-4 (OpenAI), gemma-2-9b-it (Google), Phi-3-small-128k-instruct (Microsoft).
Đây là bước tiến vượt bậc của công nghệ AI Việt khi khắc phục nhiều thách thức như hạn chế về hạ tầng, tài nguyên dữ liệu và kinh nghiệm huấn luyện so với các nước phát triển.

Hạ tầng và dữ liệu: Bí quyết tạo nên thành công
Zalo đã trang bị hệ thống tính toán mạnh mẽ với 8 máy chủ DGX H100, sử dụng GPU Nvidia mới nhất với hiệu suất 256 petaFLOPS, tạo nền tảng huấn luyện LLM vượt trội.
Bên cạnh đó, nguồn dữ liệu tiếng Việt chất lượng cao cũng được đầu tư bài bản, giúp mô hình phát triển ổn định. Đội ngũ kỹ sư đã tận dụng thời gian nghiên cứu trên GPU dân dụng để chuẩn bị nền tảng kiến thức, sẵn sàng đẩy nhanh tiến độ khi có hạ tầng tính toán mạnh.
Chỉ sau 6 tháng huấn luyện năm 2023, Zalo đã hoàn thiện mô hình 7 tỷ tham số, đạt 150% năng lực GPT-3.5 (OpenAI) trên bộ tiêu chuẩn VMLU. Thành công này đặt nền móng cho việc triển khai các ứng dụng thực tiễn, phục vụ cộng đồng.

Hướng tới kỷ nguyên AI đột phá
Zalo cho biết sẽ tiếp tục đầu tư phát triển mô hình LLM nhằm mang đến nhiều ứng dụng AI chất lượng cao, góp phần vào kỷ nguyên đổi mới sáng tạo, chuyển đổi số và làm chủ công nghệ AI tiên tiến của Việt Nam.
Theo: tin360