Sản lượng mô hình AI của Ấn Độ chậm so với Mỹ, Châu Âu và Trung Quốc. Chỉ có một số công ty khởi nghiệp phát hành mô hình và hầu hết trong số đó là mô hình ngôn ngữ lớn hoặc mô hình giọng nói.
Để khuyến khích phát triển hơn nữa, chính phủ đã khởi động Sứ mệnh AI Ấn Độ, một sáng kiến trị giá khoảng 1,2 tỷ USD, cùng với những sáng kiến khác, cho phép các công ty khởi nghiệp được chọn truy cập vào tính toán GPU được trợ cấp để đổi lấy việc phát hành công khai mô hình của họ.
Một trong 12 công ty khởi nghiệp được chọn tham gia chương trình, Avataar AI, đã ra mắt một mô hình video mới có tên Varya được xây dựng để hiểu bối cảnh địa phương, chẳng hạn như xác định các lễ hội, ẩm thực và quần áo khác nhau.
Công ty khởi nghiệp được Peak XV hậu thuẫn, tập trung vào việc tạo các công cụ video cho thương mại điện tử, đã không xây dựng Varya từ đầu.
Nó bắt đầu với Wan 2.2, một mô hình tạo video có sẵn công khai do Alibaba phát hành và sử dụng một kỹ thuật gọi là chưng cất, về cơ bản là nén các khả năng của mô hình thành một phiên bản gọn gàng hơn, nhanh hơn được tối ưu hóa cho các trường hợp sử dụng cụ thể của Avataar.
Kết quả là một mô hình chạy theo bốn bước thay vì 50 bước của Wan 2.2, tạo ra video nhanh hơn 10 lần và với chi phí thấp hơn. Nói một cách cụ thể: sử dụng GPU NVIDIA H200 , Varya có thể tạo clip 720p dài 5 giây trong 45 giây, so với 1.230 giây của Wan 2.2.
Khía cạnh nổi bật nhất của Varya có thể là giá của nó. Công ty có kế hoạch tính phí ₹0,48 (0,005 USD) mỗi giây video trên dịch vụ lưu trữ của mình, rẻ hơn nhiều so với các mô hình như Veo, Kling, Luma và Runway, thường tính phí 0,10 USD trở lên mỗi giây.
Đó là mức chênh lệch giá khoảng 20 lần. "Ấn Độ là thị trường ưu tiên video.
Chúng tôi thấy điều này trên mọi sản phẩm internet tiêu dùng lớn ở Ấn Độ: video chiếm ưu thế hơn văn bản. Các mô hình video AI hiện tại quá đắt để sử dụng trên quy mô dân số ở Ấn Độ.
Nếu video AI sẽ tiếp cận được sinh viên, giáo viên, MSME, người sáng tạo, doanh nghiệp và dịch vụ công thì chi phí phải giảm đáng kể. Chi phí là cơ hội lớn nhất cho việc áp dụng AI ở Ấn Độ", Rajan Anandan, giám đốc điều hành của Peak XV nói với TechCrunch.
Các mô hình tạo hình ảnh và video thường bỏ sót các sắc thái văn hóa và tạo ra các kết quả đầu ra rập khuôn hoặc chung chung, một vấn đề mà TechCrunch đã báo cáo trước đây.
Avataar AI cho biết họ đã sử dụng dữ liệu được tuyển chọn để huấn luyện Varya nhận biết các sắc thái văn hóa bao gồm ẩm thực, quần áo, kiến trúc và lễ hội.
Varya sẽ được phát hành dưới dạng mô hình mở trên cổng AI Kosh của Ấn Độ, Kho lưu trữ tập trung của chính phủ Ấn Độ dành cho các mô hình và bộ dữ liệu AI có sẵn công khai, cùng với dữ liệu đào tạo của nó, nghĩa là các nhà phát triển có thể tự lưu trữ hoặc sửa đổi nó theo nhu cầu riêng của họ.
Avataar cũng có kế hoạch cung cấp mô hình này cho khách hàng doanh nghiệp của mình và cho biết mô hình này sẵn sàng hợp tác với các công cụ video bao gồm Higgsfield và Adobe Firefly.
Bất kỳ ai cũng có thể dùng thử ngay bây giờ trên trang web của mình bằng cách sử dụng lời nhắc bằng văn bản hoặc hình ảnh tham khảo. Sự ra mắt của Varya phản ánh sự đánh đổi cơ bản trong tham vọng AI của Ấn Độ.
Những người kỳ cựu trong ngành đã lưu ý rằng Ấn Độ có thể tạo dấu ấn trong lĩnh vực AI bằng cách tạo ra các ứng dụng và hệ sinh thái nhà phát triển mạnh mẽ thay vì cạnh tranh trên các mô hình nền tảng.
Và có lý do cho chủ nghĩa thực dụng đó: việc phát triển mô hình ở Ấn Độ chậm hơn so với các đối thủ toàn cầu do thiếu khả năng tính toán và dữ liệu chất lượng hạn chế. Sứ mệnh AI của Ấn Độ cũng là một phần trong nỗ lực rộng lớn hơn của chính phủ nhằm thu hẹp khoảng cách đó.
Năm ngoái, họ đã chọn 12 công ty khởi nghiệp, trong số đó có Avataar AI, để phát triển các mô hình AI và cung cấp cho họ khả năng tính toán tiết kiệm chi phí.
Đầu năm nay, Bộ trưởng CNTT Ashwini Vaishnaw cho biết Ấn Độ đặt mục tiêu thu hút 200 tỷ USD đầu tư vào AI vào năm 2028 và tăng hơn gấp đôi GPU c... năng lực trong vòng sáu tháng.
Khi bạn mua hàng thông qua các liên kết trong bài viết của chúng tôi, chúng tôi có thể kiếm được một khoản hoa hồng nhỏ. Điều này không ảnh hưởng đến tính độc lập biên tập của chúng tôi.
Ivan đề cập đến sự phát triển công nghệ tiêu dùng toàn cầu tại TechCrunch. Anh ấy sống ở Ấn Độ và trước đây đã từng làm việc tại các ấn phẩm bao gồm Huffington Post và The Next Web.
Bạn có thể liên hệ hoặc xác minh khả năng tiếp cận của Ivan bằng cách gửi email tới
[email protected] hoặc qua tin nhắn được mã hóa tại ivan.42 trên Signal.
Tìm hiểu sâu hơn về những gì cần thiết để mở rộng quy mô và thành công từ các nhà lãnh đạo tại Mach Industries, Founders Fund và Shinkei Systems.
Thông qua các cuộc trò chuyện thẳng thắn bên lò sưởi và kết nối mạng có tác động cao, bạn sẽ có được những hiểu biết sâu sắc có giá trị và các kết nối mới.
Các nhà nghiên cứu an ninh mạng không hài lòng về các biện pháp bảo vệ trên Truyện ngụ ngôn Lorenzo Franceschi-Bicchierai của Anthropic Google vừa bắn một phát súng cảnh báo trong cuộc chiến giá đăng ký AI Lucas Ropek Connie Loizos WWDC 2026: Mọi thứ được công bố trên Siri AI, iOS 27, Apple Intelligence, v.v.
Morgan Little Aisha Malik Claude Fable 5 của Anthropic là một phiên bản của Mythos mà công chúng có thể truy cập ngày hôm nay Rebecca Bellan Các công cụ nguồn mở của Microsoft đã bị hack để đánh cắp mật khẩu của nhà phát triển A...
Gợi ý thực hành:
1. Theo dõi thông báo từ cơ quan địa phương tại California.
2. Kiểm tra nguồn chính thức trước khi chia sẻ lại thông tin.