OpenAI ra mắt hai mô hình AI suy luận mở đầu tiên sau 5 năm

OpenAI đã công bố ra mắt hai mô hình AI suy luận có trọng số mở với khả năng tương tự dòng mô hình o-series của hãng vào thứ ba. Cả hai mô hình đều có thể tải miễn phí từ nền tảng phát triển trực tuyến Hugging Face, với công ty mô tả đây là những mô hình “tiên tiến nhất” khi so sánh trên nhiều tiêu chuẩn đánh giá các mô hình mở.

Hai mô hình được phát hành với hai kích cỡ khác nhau: mô hình gpt-oss-120b lớn hơn và mạnh mẽ hơn có thể chạy trên một GPU Nvidia đơn lẻ, và mô hình gpt-oss-20b nhẹ hơn có thể chạy trên laptop cá nhân với 16GB bộ nhớ. Đây là lần đầu tiên OpenAI phát hành mô hình ngôn ngữ “mở” kể từ GPT-2 được ra mắt cách đây hơn năm năm.

Trong buổi thông tin, OpenAI cho biết các mô hình mở của họ có khả năng gửi các truy vấn phức tạp đến các mô hình AI trên đám mây, như TechCrunch đã đưa tin trước đó. Điều này có nghĩa là nếu mô hình mở của OpenAI không thể thực hiện một tác vụ nào đó, chẳng hạn như xử lý hình ảnh, các nhà phát triển có thể kết nối mô hình mở với một trong những mô hình đóng mạnh mẽ hơn của công ty.

Mặc dù OpenAI từng mã nguồn mở các mô hình AI trong những ngày đầu, công ty thường ưa chuộng cách tiếp cận phát triển độc quyền, mã nguồn đóng. Chiến lược sau này đã giúp OpenAI xây dựng một doanh nghiệp lớn bằng cách bán quyền truy cập vào các mô hình AI thông qua API cho các doanh nghiệp và nhà phát triển.

Tuy nhiên, CEO Sam Altman đã nói vào tháng 1 rằng ông tin OpenAI đã đứng “ở phía sai của lịch sử” khi nói đến việc mã nguồn mở các công nghệ của mình. Công ty hiện đang đối mặt với áp lực ngày càng tăng từ các phòng thí nghiệm AI Trung Quốc – bao gồm DeepSeek, Qwen của Alibaba và Moonshot AI – đã phát triển một số mô hình mở có khả năng và phổ biến nhất thế giới. Trong khi Meta trước đây thống trị không gian AI mở, các mô hình AI Llama của công ty đã tụt lại phía sau trong năm qua.

Vào tháng 7, Chính quyền Trump cũng đã thúc giục các nhà phát triển AI Mỹ mã nguồn mở nhiều công nghệ hơn để thúc đẩy việc áp dụng AI toàn cầu phù hợp với các giá trị Mỹ.

Với việc phát hành gpt-oss, OpenAI hy vọng sẽ được ưa chuộng bởi cả các nhà phát triển và Chính quyền Trump, cả hai đều đã chứng kiến các phòng thí nghiệm AI Trung Quốc vươn lên nổi bật trong không gian mã nguồn mở.

“Quay trở lại khi chúng tôi bắt đầu vào năm 2015, sứ mệnh của OpenAI là đảm bảo AGI mang lại lợi ích cho toàn nhân loại”, CEO OpenAI Sam Altman nói trong một tuyên bố chia sẻ với TechCrunch. “Vì mục đích đó, chúng tôi hào hứng khi thế giới sẽ xây dựng trên một hệ thống AI mở được tạo ra tại Hoa Kỳ, dựa trên các giá trị dân chủ, có sẵn miễn phí cho tất cả và mang lại lợi ích rộng rãi.”

OpenAI nhằm mục đích làm cho mô hình mở của mình trở thành dẫn đầu trong số các mô hình AI có trọng số mở khác, và công ty tuyên bố đã làm được điều đó. Trên Codeforces (với công cụ), một bài kiểm tra lập trình cạnh tranh, gpt-oss-120b và gpt-oss-20b đạt điểm lần lượt là 2622 và 2516, vượt trội so với R1 của DeepSeek nhưng kém hơn o3 và o4-mini.

Trên bài kiểm tra “Humanity’s Last Exam”, một bài kiểm tra thử thách với các câu hỏi từ cộng đồng trên nhiều chủ đề khác nhau (với công cụ), gpt-oss-120b và gpt-oss-20b đạt điểm lần lượt là 19% và 17.3%. Tương tự, điều này kém hơn o3 nhưng vượt trội so với các mô hình mở hàng đầu từ DeepSeek và Qwen.

Đáng chú ý, các mô hình mở của OpenAI có hiện tượng ảo giác (hallucination) nhiều hơn đáng kể so với các mô hình AI suy luận mới nhất của họ, o3 và o4-mini. OpenAI nhận thấy rằng gpt-oss-120b và gpt-oss-20b có hiện tượng ảo giác trong việc trả lời 49% và 53% câu hỏi trên PersonQA, tiêu chuẩn đánh giá nội bộ của công ty để đo độ chính xác của kiến thức mô hình về con người.

OpenAI cho biết các mô hình mở của họ được huấn luyện bằng các quy trình tương tự như các mô hình độc quyền. Công ty nói rằng mỗi mô hình mở tận dụng mixture-of-experts (MoE) để khai thác ít tham số hơn cho bất kỳ câu hỏi nào, giúp chạy hiệu quả hơn. Đối với gpt-oss-120b, có tổng cộng 117 tỷ tham số, OpenAI cho biết mô hình chỉ kích hoạt 5,1 tỷ tham số mỗi token.

Công ty cũng cho biết mô hình mở của họ được huấn luyện bằng học tăng cường (RL) tính toán cao – một quy trình hậu huấn luyện để dạy các mô hình AI phân biệt đúng sai trong môi trường mô phỏng sử dụng các cụm GPU Nvidia lớn. Điều này cũng được sử dụng để huấn luyện dòng mô hình o-series của OpenAI, và các mô hình mở có quy trình chuỗi suy nghĩ tương tự trong đó chúng mất thêm thời gian và tài nguyên tính toán để xử lý câu trả lời.

OpenAI phát hành gpt-oss-120b và gpt-oss-20b theo giấy phép Apache 2.0, thường được coi là một trong những giấy phép cho phép nhất. Giấy phép này sẽ cho phép các doanh nghiệp kiếm tiền từ các mô hình mở của OpenAI mà không cần phải trả tiền hoặc xin phép từ công ty.

Tuy nhiên, không giống như các dịch vụ mã nguồn mở hoàn toàn từ các phòng thí nghiệm AI như AI2, OpenAI cho biết họ sẽ không phát hành dữ liệu huấn luyện được sử dụng để tạo ra các mô hình mở của mình. Quyết định này không gây bất ngờ vì một số vụ kiện đang diễn ra chống lại các nhà cung cấp mô hình AI, bao gồm cả OpenAI, đã cáo buộc rằng các công ty này đã huấn luyện mô hình AI của họ một cách không phù hợp trên các tác phẩm có bản quyền.

OpenAI đã trì hoãn việc phát hành các mô hình mở của mình nhiều lần trong những tháng gần đây, một phần để giải quyết các mối quan ngại về an toàn. Ngoài các chính sách an toàn thông thường của công ty, OpenAI cho biết trong một báo cáo trắng rằng họ cũng đã điều tra xem liệu các tác nhân xấu có thể tinh chỉnh các mô hình gpt-oss của mình để hữu ích hơn trong các cuộc tấn công mạng hay việc tạo ra vũ khí sinh học hoặc hóa học hay không.

Sau khi thử nghiệm từ OpenAI và các đánh giá viên bên thứ ba, công ty cho biết gpt-oss có thể tăng khả năng sinh học một cách cận biên. Tuy nhiên, họ không tìm thấy bằng chứng rằng các mô hình mở này có thể đạt được ngưỡng “khả năng cao” của họ về mức độ nguy hiểm trong các lĩnh vực này, ngay cả sau khi tinh chỉnh.

Mặc dù mô hình của OpenAI dường như là tiên tiến nhất trong số các mô hình mở, các nhà phát triển đang háo hức chờ đợi việc phát hành DeepSeek R2, mô hình AI suy luận tiếp theo của họ, cũng như một mô hình mở mới từ phòng thí nghiệm siêu trí tuệ mới của Meta.

Thẻ