Nội dung bài viết
Cuộc đua silicon đang nóng lên trong bối cảnh phải vật lộn để theo kịp nhu cầu.
OpenAI, công ty đứng sau ChatGPT và Codex cùng các mô hình mà các công cụ đó sử dụng, và Broadcom, một nhà cung cấp silicon có uy tín, đã công bố một con chip mới có tên Jalapeño, được thiết kế đặc biệt cho suy luận mô hình ngôn ngữ lớn trong các trung tâm dữ liệu.
Con chip này dự định sẽ được triển khai tại các trung tâm dữ liệu lớn, cả hai công ty đều khẳng định đây chỉ là thế hệ đầu tiên trong một dự án dài hạn sẽ chứng kiến các con chip được tinh chỉnh theo thời gian.
Broadcom nói rằng ASIC (Mạch tích hợp dành riêng cho ứng dụng) này được thiết kế từ đầu để suy luận LLM, dựa trên “những hiểu biết chi tiết” từ các cuộc trò chuyện của công ty với các nhà nghiên cứu tại OpenAI và rằng sự phát triển của chip đã được thông báo bởi lộ trình riêng của OpenAI cho các mô hình và sản phẩm trong tương lai.
Quá trình thiết kế và sản xuất con chip này mất tới 9 tháng. Lời hứa là con chip này chuyên dụng hơn cho nhu cầu hiện tại của LLM so với những con chip mà hệ thống suy luận hiện đang chạy trong các trung tâm dữ liệu hiện có.
OpenAI tuyên bố rằng “thử nghiệm ban đầu cho thấy Jalapeño sẽ mang lại hiệu suất trên mỗi watt tốt hơn đáng kể so với công nghệ hiện đại nhất hiện nay”, nhưng lưu ý rằng việc đo lường hiệu suất vẫn chưa được thực hiện. rmance và “báo cáo kỹ thuật chi tiết sẽ được trình bày trong những tháng tới”.
Công ty, được biết đến với các dịch vụ và khai thác ChatGPT và Codex, hy vọng cuối cùng sẽ sở hữu toàn bộ các mô hình và sản phẩm của mình, giảm sự phụ thuộc vào các công ty bên ngoài như Nvidia và có vẻ như mang lại hiệu suất hoặc hiệu quả tốt hơn nhờ tích hợp dọc.
Tổng quát hơn, OpenAI và các đối thủ cạnh tranh của nó quan tâm đến silicon tùy chỉnh vì đây là một cách khác để có thể tận dụng nhiều công suất hơn trong bối cảnh khủng hoảng điện toán toàn cầu, khi các công ty cạnh tranh tranh giành công suất trung tâm dữ liệu hạn chế.
Mặc dù Broadcom đã là nhà sản xuất chip thành công cho những khách hàng đang xây dựng cơ sở hạ tầng điện toán, nhưng gần đây họ đã chứng kiến sự chuyển biến đáng kể khi xây dựng hoạt động kinh doanh mới xung quanh việc cung cấp chip tùy chỉnh cho các công ty siêu quy mô và các nhóm xây dựng mô hình tiên phong trong thời kỳ bùng nổ AI hiện nay.
Cả hai công ty đều tuyên bố chip Jalapeño sẽ được triển khai tại các trung tâm dữ liệu vào cuối năm nay. Ars Technica đã tách tín hiệu khỏi tiếng ồn trong hơn 25 năm.
Với sự kết hợp độc đáo giữa hiểu biết về kỹ thuật và mối quan tâm sâu rộng đến nghệ thuật và khoa học công nghệ, Ars là nguồn được sử dụng trong một biển thông tin. Suy cho cùng, bạn không cần phải biết mọi thứ, chỉ cần biết những gì quan trọng.
Gợi ý thực hành:
1. Theo dõi thông báo từ cơ quan địa phương tại California.
2. Kiểm tra nguồn chính thức trước khi chia sẻ lại thông tin.