Năm 2025, các mô hình AI đang được phát triển với tốc độ chóng mặt bởi cả các công ty công nghệ lớn lẫn các startup. Việc theo dõi và nắm bắt thông tin về những mô hình mới nhất có thể gây khó khăn cho nhiều người. Để giúp người dùng có cái nhìn tổng quan hơn, TechCrunch đã tổng hợp một danh sách các mô hình AI nổi bật nhất được ra mắt trong năm 2025, cùng với thông tin chi tiết về cách sử dụng và ưu điểm của chúng.


1. OpenAI GPT 4.5 Orion


OpenAI đã ra mắt GPT-4.5 Orion, mô hình ngôn ngữ lớn nhất từ trước đến nay của hãng, với kích thước và sức mạnh tính toán vượt trội so với các phiên bản tiền nhiệm. Được quảng bá là “bước tiến lớn trong việc mở rộng quy mô huấn luyện trước và sau huấn luyện” (pre-training và post-training), GPT-4.5 tập trung vào học không giám sát (unsupervised learning), giúp cải thiện khả năng nhận diện mẫu, kết nối thông tin và tạo ra những hiểu biết sáng tạo mà không cần suy luận từng bước.  



Theo các nhà nghiên cứu tại OpenAI, GPT-4.5 sở hữu “kiến thức thế giới sâu hơn” và “trí thông minh cảm xúc cao hơn”, mang đến trải nghiệm trò chuyện tự nhiên hơn và giảm thiểu hiện tượng “ảo tưởng” (hallucination) – khi AI tạo ra thông tin sai lệch.  


Về khả năng tích hợp, GPT-4.5 hỗ trợ tìm kiếm web, tính năng canvas, cùng với khả năng tải lên tệp và hình ảnh, mang lại sự linh hoạt và tiện ích trong nhiều tình huống sử dụng. Tuy nhiên, mô hình này vẫn chưa tương thích với Chế độ Giọng nói AI (AI Voice Mode), một điểm hạn chế trong trải nghiệm tương tác bằng giọng nói. 


Trong bài đăng công bố, OpenAI đã chia sẻ kết quả kiểm tra học thuật cho thấy GPT-4.5 có hiệu suất vượt trội ở các bài kiểm tra ngôn ngữ, nhưng lại bị o3-mini vượt xa về toán học và thua nhẹ ở các bài kiểm tra khoa học. Điều này cho thấy, mặc dù có nhiều cải tiến về tư duy ngôn ngữ và cảm xúc, GPT-4.5 vẫn còn khoảng trống cần cải thiện ở các lĩnh vực chuyên môn khác.


GPT-4.5 cho thấy khả năng tạo ra hình ảnh hợp lý chỉ bằng các đoạn code 


2. Claude Sonnet 3.7


Anthropic, công ty nghiên cứu và phát triển trí tuệ nhân tạo, đã ra mắt Claude 3.7 Sonnet với hiệu suất vượt trội so với phiên bản trước đó (Claude 3.5 Sonnet), đặc biệt trong các nhiệm vụ phức tạp như lập trình và toán học. Điểm nổi bật nhất của mô hình này là khả năng “lập luận lai” (hybrid reasoning), cho phép giải quyết hiệu quả các vấn đề đòi hỏi nhiều bước suy luận liên tiếp. Phiên bản miễn phí được cung cấp cho người dùng Claude, trong khi gói Pro với tính năng chuyên sâu có mức giá 20 USD mỗi tháng.



Trong khi các đối thủ như OpenAI đang cung cấp các mô hình “lập luận” riêng biệt, Anthropic lại đi theo một hướng tiếp cận khác. Bà Dianne Penn, Trưởng nhóm Nghiên cứu Sản phẩm của Anthropic, chia sẻ với The Verge rằng công ty muốn “đơn giản hóa trải nghiệm sử dụng AI” bằng cách tích hợp khả năng lập luận vào hệ thống, thay vì phải sử dụng nhiều mô hình riêng biệt cho từng nhiệm vụ.  


Theo bà Penn, “lập luận” (reasoning) không nên được tách biệt thành một tính năng riêng mà cần trở thành một phần tự nhiên của AI. Điều này đồng nghĩa với việc Claude 3.7 có thể xử lý mọi yêu cầu từ đơn giản như “Mấy giờ rồi?” đến phức tạp như “Lập kế hoạch chuyến đi hai tuần đến Ý trong tháng Ba, với lưu ý về thời tiết” mà không cần phải chuyển đổi mô hình.  


Cách tiếp cận thống nhất này giúp Claude 3.7 trở nên linh hoạt và dễ sử dụng hơn, loại bỏ hoàn toàn việc lựa chọn mô hình phù hợp cho từng loại tác vụ. Người dùng chỉ cần tương tác một cách tự nhiên, trong khi AI tự động áp dụng khả năng lập luận trong mọi tình huống, từ đơn giản đến phức tạp, mang lại trải nghiệm nhất quán và tiện lợi.


3. xAI Grok 3


Được phát triển bởi xAI - công ty do Elon Musk sáng lập, Grok 3 là mô hình tiên tiến trong lĩnh vực toán học, khoa học và lập trình. Được trang bị khả năng lý luận vượt trội, Grok 3 cho phép suy nghĩ sâu hơn khi xử lý các truy vấn phức tạp. Tốc độ phản hồi nhanh và ngôn ngữ tự nhiên, cùng với hỗ trợ tiếng Việt, là những điểm mạnh đáng chú ý. Elon Musk từng hài hước chia sẻ: "Grok 3 hiện mở miễn phí cho đến khi máy chủ của chúng tôi bị sập", nhưng chưa xác định thời hạn cụ thể.



xAI cũng ra mắt một công cụ mới cho Grok 3 mang tên DeepSearch, với mục tiêu nâng cao khả năng nghiên cứu, suy nghĩ và phân tích dữ liệu. Công cụ này không chỉ giúp xử lý các truy vấn một cách hiệu quả mà còn giải thích rõ ràng cách thức đưa ra câu trả lời, tạo ra trải nghiệm minh bạch và đáng tin cậy cho người dùng. Theo báo cáo từ Business Insider, xAI đã bắt đầu phát triển DeepSearch từ cuối năm ngoái, cho thấy sự đầu tư lâu dài và nghiêm túc vào việc cải thiện khả năng phân tích của Grok 3.


xAI đưa ra hàng loạt bài kiểm tra benchmark để cho thấy Grok 3 cao hơn Gemini 2 Pro, Claude 3.5 Sonnet, GPT 4o và DeepSeek V3 khi xét đếm điểm chuẩn Toán, Khoa học và Mã hóa


4. DeepSeek R1


DeepSeek là một công ty trí tuệ nhân tạo (AI) của Trung Quốc, được thành lập vào năm 2023 bởi Liang Wenfeng. Chuyên phát triển các mô hình ngôn ngữ lớn (LLM) mã nguồn mở, công ty nhận được sự tài trợ hoàn toàn từ quỹ đầu tư mạo hiểm Trung Quốc High-Flyer. Điểm nổi bật của DeepSeek nằm ở chiến lược mã nguồn mở, khi cung cấp miễn phí mã nguồn và tài liệu thiết kế của chatbot, tạo điều kiện cho người dùng dễ dàng truy cập, sử dụng và tùy chỉnh theo nhu cầu.



Vào ngày 10/01/2025, DeepSeek ra mắt chatbot miễn phí đầu tiên mang tên DeepSeek R1. Chỉ sau chưa đầy một tháng, vào ngày 27/1, ứng dụng này đã nhanh chóng vượt qua ChatGPT, trở thành ứng dụng miễn phí được tải xuống nhiều nhất trên App Store của iOS tại Hoa Kỳ. Thành công này thậm chí còn khiến giá cổ phiếu của Nvidia giảm 18%, gây ra sự xáo trộn đáng kể trong ngành công nghệ.  


DeepSeek R1 là một mô hình lý luận tiên tiến với khả năng tự kiểm tra tính chính xác, giúp tránh được nhiều cạm bẫy mà các mô hình khác thường mắc phải. Mặc dù thời gian để R1 đưa ra giải pháp thường kéo dài từ vài giây đến vài phút, nhưng đổi lại, nó mang lại độ tin cậy cao trong các lĩnh vực phức tạp như vật lý, khoa học và toán học.


Theo DeepSeek, R1 được phát triển dựa trên các kỹ thuật học tăng cường và suy luận chuỗi, giúp nâng cao độ chính xác trong quá trình xử lý. Nhờ đó, hiệu suất của R1 tương đương với OpenAI trong các tác vụ toán học, lập trình và lý luận. Người dùng có thể truy cập mô hình thông qua trang web hoặc API của công ty, mang lại sự linh hoạt và tiện lợi trong việc ứng dụng.


5. Mistral Le Chat


Le Chat của Mistral được thiết kế như một trợ lý cá nhân đa phương tiện, nổi bật với khả năng phản hồi nhanh hơn bất kỳ chatbot AI nào khác. Người dùng có thể lựa chọn phiên bản miễn phí hoặc trả phí, tùy vào nhu cầu sử dụng. Theo đánh giá từ Le Monde, dù có hiệu suất ấn tượng, Le Chat vẫn còn một số lỗi nhất định khi so sánh với ChatGPT.



Le Chat được đánh giá cao nhờ khả năng truy cập internet để cung cấp câu trả lời với dữ liệu mới nhất, cùng với tính năng tải lên file PDF và hình ảnh để phân tích. Bên cạnh đó, ứng dụng còn hỗ trợ nhiều công cụ hữu ích như canvas, trình thông dịch mã và khả năng tạo hình ảnh.  


Một trong những hạn chế đáng chú ý của Le Chat là mỗi tính năng dường như có giới hạn riêng, điển hình như khả năng truy cập web. Sau một vài lần tìm kiếm, bot của Le Chat đã đưa ra thông báo không thể lấy thông tin cập nhật do đã đạt giới hạn tìm kiếm web. Điều này ảnh hưởng đáng kể đến trải nghiệm người dùng, và Mistral AI cần sớm khắc phục hoặc cung cấp giải thích cụ thể để nâng cao tính ổn định của ứng dụng.


6. OpenAI Operator


Được phát triển như một trợ lý cá nhân thông minh, Operator của OpenAI có khả năng tự động thực hiện các công việc như mua sắm trực tuyến. Cụ thể, OpenAI Operator mang đến khả năng tương tác trực tiếp với giao diện người dùng trên web bằng cách nhấp chuột, nhập liệu và điều hướng qua các menu. Nhờ đó, công cụ này có thể thực hiện hàng loạt tác vụ như đặt vé du lịch, đặt nhà hàng, hỗ trợ mua sắm trực tuyến với các tính năng lọc, tìm kiếm sản phẩm, điền thông tin và xử lý các công việc lặp đi lặp lại.  


Không chỉ vậy, OpenAI Operator còn giúp quản lý quy trình làm việc cá nhân bằng cách lưu trữ các prompt hoặc thiết lập mà người dùng thường xuyên thực hiện trên một trang web nhất định. Đặc biệt, công cụ này có khả năng xử lý đồng thời nhiều nhiệm vụ và tự động sửa lỗi khi gặp khó khăn, mang lại trải hiệu quả cho người dùng.



Dù được triển khai qua gói ChatGPT Pro với mức phí 200 USD mỗi tháng, mô hình này vẫn gây ra nhiều tranh cãi. Ví dụ, biên tập viên từ Washington Post đã gặp sự cố khi Operator tự động mua một tá trứng với giá 31 USD từ thẻ tín dụng của người này, cho thấy rủi ro tiềm ẩn trong việc tự ra quyết định.


7. Google Gemini 2.0 Pro Experimental


Gemini 2.0 ra mắt với hai phiên bản nổi bật, mỗi phiên bản mang đến những ưu điểm riêng biệt. Trong khi Gemini 2.0 Flash tập trung vào tốc độ và hiệu quả xử lý, thì Gemini 2.0 Pro Experimental lại gây ấn tượng bởi khả năng mã hóa vượt trội và khả năng xử lý các tác vụ phức tạp. Google tự tin khẳng định đây là mô hình “mạnh mẽ nhất” mà họ từng phát triển, với năng lực hiểu và suy luận kiến thức thế giới một cách sâu rộng.  


Đáng chú ý, Gemini 2.0 Pro Experimental sở hữu cửa sổ ngữ cảnh lên tới 2 triệu token, giúp phân tích và xử lý khối lượng lớn thông tin một cách hiệu quả. Bên cạnh đó, khả năng tích hợp các công cụ như Google Search và thực thi mã càng làm tăng thêm tính linh hoạt và đa năng cho mô hình này. Hiện tại, Gemini 2.0 Pro Experimental đã có mặt trên Google AI Studio, Vertex AI và đang được cung cấp dưới dạng thử nghiệm cho người dùng Gemini Advanced.



Như Quỳnh (Theo TechCruch)


Subscribe Newsletter của Advertising Vietnam để theo dõi nhiều tin tức hấp dẫn về ngành quảng cáo.