OpenAI ra mắt o3-mini - mô hình suy luận hiệu quả về chi phí nhằm cạnh tranh với DeepSeek
OpenAI vừa ra mắt o3-mini, một mô hình mới, tiết kiệm chi phí hơn, có sẵn cho cả ChatGPT và OpenAI. O3-mini ra mắt vào thời điểm OpenAI đang hướng tới mục tiêu bắt kịp công ty DeepSeek của Trung Quốc.
Theo đó, o3-mini được cho rằng "mở rộng ranh giới" của những gì có thể thực hiện được với các mô hình nhỏ hơn, hiệu quả hơn. o3-mini được thiết kế cho các khả năng STEM và có thế mạnh đặc biệt về khoa học, toán học và lập trình. o3-mini có khả năng tìm kiếm và có thể tìm thấy các câu trả lời mới nhất với các liên kết đến các nguồn web có liên quan.
o3-mini là mô hình lý luận nhỏ đầu tiên của OpenAI hỗ trợ các tính năng quan trọng dành cho các nhà phát triển như gọi hàm (funtion calling), đầu ra có cấu trúc (structured outputs) và tin nhắn của nhà phát triển (developer messages).
Có ba tùy chọn nỗ lực lý luận, bao gồm thấp, trung bình và cao, để tối ưu hóa cho các trường hợp sử dụng khác nhau ưu tiên sức mạnh xử lý cho các thách thức phức tạp hoặc tốc độ.
OpenAI giữ o1 làm mô hình lý luận kiến thức chung tiêu chuẩn, còn o3-mini có sẵn cho các lĩnh vực kỹ thuật đòi hỏi độ chính xác và tốc độ. Khi sử dụng với ChatGPT, o3-mini sử dụng nỗ lực lý luận trung bình để cân bằng giữa tốc độ và độ chính xác và o3-mini cao là một tùy chọn trong trình chọn mô hình.
Thông cáo báo chí của OpenAI cho biết, với trí thông minh tương đương với OpenAI o1, OpenAI o3-mini mang lại hiệu suất nhanh hơn và hiệu quả được cải thiện. o3-mini cho thấy kết quả vượt trội trong các đánh giá toán học và thực tế bổ sung với nỗ lực suy luận trung bình. Trong thử nghiệm A/B, o3-mini đưa ra phản hồi nhanh hơn 24% so với o1-mini, với thời gian phản hồi trung bình là 7,7 giây so với 10,16 giây.
Người dùng ChatGPT Plus, Team và Pro có thể sử dụng o3-mini và nó sẽ thay thế o1-mini trong trình chọn mô hình.
o3-mini hiện đã có sẵn cho người dùng ChatGPT Plus, Team và Pro, thay thế hoàn toàn o1-mini trong trình chọn mô hình. Người dùng có thể chọn "o3-mini-high" để ưu tiên trí thông minh cao hơn, dù phải đánh đổi thời gian phản hồi lâu hơn.
Người dùng ChatGPT Pro được truy cập không giới hạn vào cả o3-mini và o3-mini-high, trong khi người dùng Plus và Team sẽ có giới hạn cao hơn, từ 50 tin nhắn/ngày với o1-mini lên 150 tin nhắn/ngày với o3-mini.
Người dùng miễn phí của ChatGPT cũng có thể trải nghiệm o3-mini bằng cách chọn "Reason" trong trình soạn tin nhắn hoặc tạo lại phản hồi, đánh dấu lần đầu tiên OpenAI cung cấp mô hình lý luận cho nhóm người dùng này. Ngoài ChatGPT, o3-mini cũng đã có mặt trên Dịch vụ Azure OpenAI của Microsoft, mở rộng khả năng tiếp cận cho doanh nghiệp và nhà phát triển trên toàn cầu.
Việc OpenAI ra mắt o3-mini diễn ra trong bối cảnh loạt mô hình từ DeepSeek V3/R1 đang làm mưa làm gió do cung cấp tính năng tương đương trong khi giá thành rẻ hơn hàng chục lần. Theo OpenAI, o3-mini có giá 0,55 USD cho một triệu token đầu vào lưu trong bộ nhớ đệm và 4,4 USD cho một triệu token đầu ra (một triệu token tương đương khoảng 750.000 từ). Con số này rẻ hơn 63% so với o1-mini và cạnh tranh với giá của mô hình lý luận R1 của DeepSeek.
Với khả năng xử lý nhanh hơn, suy luận mạnh mẽ và các tính năng tối ưu cho nhà phát triển, o3-mini hứa hẹn sẽ trở thành lựa chọn lý tưởng cho những ai cần một mô hình AI hiệu quả về chi phí mà vẫn đảm bảo hiệu suất cao.
Sự ra mắt của o3-mini đánh dấu bước tiến quan trọng của OpenAI trong việc đưa công nghệ AI đến gần hơn với nhiều đối tượng người dùng.