Nội dung bài viết
StrictlyVC đầu tiên của năm 2026 sẽ ra mắt SF vào ngày 30 tháng 4. Vé đang bán rất nhanh.
Đăng ký ngay bây giờ. Nhận khoản tiết kiệm từ chương trình Disrupt Early Bird lên tới 410 USD trước 11:59 tối ngày 29 tháng 5.
PT. Đăng ký ngay bây giờ.
Nhu cầu ngày càng tăng về máy tính chạy các mô hình AI ngày càng tăng, nhưng có hai trở ngại lớn mà bất kỳ ai trong doanh nghiệp cần phải vượt qua: có được chip phù hợp và đưa chúng vào trung tâm dữ liệu nơi họ có thể bắt đầu tạo doanh thu.
General Computing, một neocloud suy luận mới, một công ty cho thuê sức mạnh xử lý AI, chuyên về giai đoạn khi các mô hình đang chạy và phản hồi người dùng thay vì được đào tạo, có câu trả lời cho những câu hỏi làm sáng tỏ hướng đi của hệ sinh thái AI.
Những câu trả lời đó đã giúp họ huy động được vòng hạt giống trị giá 15 triệu đô la với mức định giá sau gọi vốn là 60 triệu đô la, do FUSE VC dẫn đầu với sự tham gia của Carya Venture Partners và Village Global Ventures. Đầu tiên, con chip phù hợp là gì?
Nhu cầu về GPU đã tăng vọt, nhưng người ta thường hiểu rằng chúng không phải là chip phù hợp nhất để chạy các mô hình AI một khi chúng đã được đào tạo.
Giai đoạn của AI trong đó một mô hình đang tích cực tạo ra phản hồi có các yêu cầu tính toán khác với đào tạo và một loại chip mới đang được thiết kế dành riêng cho nó. Giao dịch Groq trị giá 20 tỷ USD của Nvidia vào tháng 12 và đợt IPO trị giá 57 tỷ USD của Cerebras vào tuần trước đã chỉ đường.
Với năng lực hạn chế ở cả hai công ty này, những người đồng sáng lập General Computer, CEO Finn Puklowski và CTO Jason Goodison, đã tìm ra một lựa chọn khác.
Họ đang chuyển sang sử dụng các chip chuyên dụng do SambaNova, một nhà sản xuất chip được Intel hậu thuẫn, tập trung vào suy luận, điều này hơi khác so với cuộc trò chuyện ở Thung lũng Silicon. Điều đó có thể thay đổi khi SambaNova phát hành chip mới trong năm nay.
Kiến trúc linh hoạt hơn và sử dụng nhiều bộ nhớ hơn để lưu trữ ngữ cảnh trong quá trình tính toán suy luận và SambaNova tuyên bố rằng nó hoạt động tốt hơn không chỉ GPU mà còn cả các chip chuyên dụng khác do Groq hoặc Cerebras chế tạo.
Puklowski cho biết các chip mới sẽ tạo ra 600 đến 700 mã thông báo mỗi giây, so với khoảng 250 mã thông báo mỗi giây đối với GPU. General Computing đã đặt hàng chip SN50 trị giá 300 triệu USD của công ty và cho biết đây sẽ là neocloud đầu tiên triển khai chúng.
Những con chip này cũng giúp giải quyết vấn đề lớn thứ hai – đặt chúng ở đâu – cho General Computing: Chúng làm mát bằng không khí, không làm mát bằng nước và tiêu thụ ít điện năng hơn, vì vậy chúng có thể làm mát bằng không khí.
n được cài đặt tại các cơ sở trung tâm dữ liệu hiện có mà không cần đầu tư cơ sở hạ tầng mới.
Puklowski đang theo đuổi các thỏa thuận colocation – các thỏa thuận trong đó General Computer cài đặt phần cứng của mình trong cơ sở của người khác – không chỉ với các nhà cung cấp trung tâm dữ liệu mà còn với các công ty khai thác tiền điện tử đang tìm cách tái sử dụng cơ sở hạ tầng của họ vì chi phí sản xuất bitcoin thường vượt quá giá của nó.
General Computer đã ra mắt dịch vụ đám mây vào tuần trước, tuyên bố đây là dịch vụ chạy MiniMax 2.7 nhanh nhất, một LLM mã nguồn mở mạnh mẽ. Joe Hasselmann là một nhà đầu tư mạo hiểm, người đã bước vào giai đoạn đầu của thời kỳ bùng nổ suy luận khi đầu tư vào Groq vào năm 2021.
Năm nay, ông đã thành lập một quỹ mới, Evercrest Capital Partners, tập trung vào không gian AI và biến General Computing trở thành một trong những khoản đầu tư đầu tiên của mình.
Hasselmann nhận thấy mối quan hệ hợp tác của SambaNova với General Computing tương đồng với mối quan hệ của CoreWeave với Nvidia, và với việc kết hợp hoạt động sản xuất chip của Groq với dịch vụ đám mây trước đây của nó.
Hasselmann nói: “Họ thực sự cần một nhóm khách hàng lành mạnh sẽ đặt chip của họ vào những môi trường sẽ có mức tăng trưởng cao đối với họ”.
“Nhiều như General Computer đang đặt cược vào SambaNova, Sam baNova đang đặt cược vào General Computing.” Câu hỏi đặt ra là loại kiến trúc máy tính nào sẽ mang lại giá trị cao nhất trong tương lai AI.
Các đám mây suy luận là sự đặt cược ngầm vào một thế giới gồm nhiều mô hình và tác nhân, một thế giới mà không có nhà cung cấp duy nhất nào thống trị và tốc độ cũng như chi phí suy luận trở thành các biến số cạnh tranh chính.
Hãy xem xét Series B trị giá 113 triệu đô la được huy động cho OpenRouter trong tuần này, phản ánh khả năng của công ty trong việc cung cấp cho khách hàng quyền truy cập vào nhiều mô hình để tối ưu hóa chi tiêu mã thông báo của họ. Tốc độ quan trọng trong tính toán đó, về giá cả và khả năng.
Puklowski muốn biến khối lượng công việc kéo dài hàng giờ của các tác nhân mã hóa thành các nhiệm vụ kéo dài 5 hoặc 10 phút và tạo ra các tác nhân âm thanh cho dịch vụ khách hàng, vốn đòi hỏi khả năng suy luận nhanh hơn để trò chuyện hiệu quả, tiết kiệm hơn.
Puklowski nói với TechCrunch: “Nếu bạn sử dụng ChatGPT và nó cung cấp cho bạn 50 mã thông báo mỗi giây, tốc độ đó vẫn nhanh hơn rất nhiều so với những gì chúng tôi có thể đọc được,” Puklowski nói với TechCrunch.
“Bây giờ mọi thứ đã chuyển sang mô hình giữa các đại lý, nơi các đại lý ở ngoài đó đọc thay mặt chúng tôi hoặc gửi cơ sở dữ liệu, họ cần phải tiến hành nhanh hơn”. Khi bạn mua hàng thông qua các liên kết trong bài viết của chúng tôi, chúng tôi có thể kiếm được một kh...
đ. StrictlyVC Athens là người tiếp theo.
Nghe những hiểu biết sâu sắc chưa được lọc trực tiếp từ các nhà lãnh đạo công nghệ của Châu Âu và kết nối với những người đang định hình những gì phía trước. Khóa tại chỗ của bạn trước khi nó biến mất.
Meta ra mắt đăng ký Instagram, Facebook và WhatsApp, cùng nhiều tính năng khác sắp ra mắt, bao gồm cả các kế hoạch AI Sarah Perez
Gợi ý thực hành:
1. Theo dõi thông báo từ cơ quan địa phương tại California.
2. Kiểm tra nguồn chính thức trước khi chia sẻ lại thông tin.