Thiếu hụt GPU, OpenAI trì hoãn ra mắt ChatGPT-4.5

- Advertisement -

OpenAI đang đối mặt với tình trạng thiếu hụt nghiêm trọng các đơn vị xử lý đồ họa (GPU), dẫn đến việc trì hoãn triển khai mô hình ChatGPT-4.5 mới nhất. GPU là thành phần quan trọng trong việc huấn luyện các mô hình trí tuệ nhân tạo, xử lý lượng dữ liệu lớn và thực hiện các phép tính phức tạp. Không giống như CPU xử lý tuần tự, GPU có khả năng xử lý song song, phù hợp hơn cho các tác vụ AI.

Trong một bài đăng trên mạng xã hội, CEO của OpenAI, Sam Altman, thông báo rằng hàng trăm nghìn chip GPU sẽ sớm được bổ sung, nhằm đáp ứng nhu cầu ngày càng tăng. Hiện tại, mô hình ChatGPT-4.5 chỉ khả dụng cho những người dùng đăng ký phiên bản Pro với mức phí hơn 5 triệu đồng mỗi tháng. Khi nguồn cung GPU được cải thiện, OpenAI dự kiến mở rộng dịch vụ này cho người dùng ChatGPT Plus với phí hơn 500 nghìn đồng mỗi tháng.

Việc thiếu hụt GPU không thể giải quyết đơn giản như việc mua mực in mới. Do đó, OpenAI đang xem xét phát triển chip riêng để giảm sự phụ thuộc vào các nhà cung cấp như NVIDIA. Altman nhấn mạnh rằng ChatGPT-4.5 không phải là mô hình lý luận và sẽ không thiết lập các kỷ lục mới về benchmark. Tuy nhiên, ông cho biết mô hình này mang lại một loại trí tuệ khác biệt và ông rất mong chờ phản hồi từ người dùng.

Đáng chú ý, ChatGPT-4.5 là một mô hình lớn và đắt đỏ, với chi phí gần 2 triệu đồng cho mỗi triệu token đầu vào và hơn 3.8 triệu đồng cho mỗi triệu token đầu ra. Trong khi đó, GPT-4o chỉ tốn 64 nghìn đồng cho mỗi triệu token đầu vào và hơn 255 nghìn đồng cho mỗi triệu token đầu ra. Token là đơn vị văn bản có thể là một chữ cái, một từ hoặc dấu câu. Các mô hình ngôn ngữ lớn thường phân chia văn bản thành các token trước khi xử lý.

Sự bùng nổ của AI đã góp phần làm tăng giá trị cổ phiếu của NVIDIA, với mức tăng 1.748,96% trong năm năm qua. Nhu cầu đối với các chip hàng đầu của NVIDIA tiếp tục gia tăng, phản ánh sự quan tâm mạnh mẽ đến AI trên thị trường.

Xem thêm: OpenAI giới thiệu phiên bản ChatGPT-4.5

- Advertisement -

Bài viết liên quan

Snapdragon G series

Qualcomm ra mắt Snapdragon G3 Gen 3, G2 Gen...

Qualcomm giới thiệu Snapdragon G3 Gen 3, G2 Gen 2 và G1 Gen 2 với hỗ trợ...
Gemini AI

Google nâng cấp Gemini AI với tính năng cá...

Google nâng cấp Gemini AI với tính năng cá nhân hóa dựa trên lịch sử tìm...
ransomware

Cảnh báo về mối đe dọa từ ransomware Medusa

Ransomware Medusa đe dọa người dùng Gmail, Outlook và VPN, một biến thể ransomware as a service...
Google Assistant

Google ngừng hỗ trợ Google Assistant

Google ngừng hỗ trợ Google Assistant trên thiết bị di động, thay thế bằng trợ lý ảo...
RCS

Apple và Google hợp tác mã hóa tin nhắn...

Apple và Google đang hợp tác với Hiệp hội GSM (GSMA) để triển khai mã hóa đầu...
infostealer

Phần mềm độc hại Infostealer lây nhiễm 26 triệu...

Phần mềm độc hại infostealer đã lây nhiễm 26 triệu thiết bị, đánh cắp dữ liệu ngân...