Nội dung bài viết
Lần đầu tiên, một vệ tinh quan sát Trái đất đã tìm thấy những gì nó đang tìm kiếm, một mình mà không cần có sự phân tích của con người trên mặt đất.
Cột mốc quan trọng xảy ra vào tháng 4, đánh dấu lần đầu tiên sử dụng mô hình ngôn ngữ thị giác trên quỹ đạo và đưa ra cái nhìn thoáng qua về cách AI có thể thay đổi căn bản khả năng của các cảm biến dựa trên không gian – và giá trị của chúng.
Thông thường, các vệ tinh tải khối dữ liệu lớn xuống cho các nhà phân tích trên Trái đất bên dưới, những người sử dụng thuật toán học máy hoặc chính con mắt của họ để tìm hiểu chuyện gì đang xảy ra.
Nhưng trên tàu Yam-9, một tàu vũ trụ do công ty cơ sở hạ tầng vũ trụ Loft Orbital chế tạo, một gói phần mềm do Phòng thí nghiệm Động cơ phản lực của NASA xây dựng đã xác định các lĩnh vực quan tâm để đáp ứng các truy vấn ngôn ngữ tự nhiên.
Gemma 3 của Google DeepMind, mô hình ngôn ngữ tầm nhìn hay VLM, hỗ trợ cho cuộc trình diễn, được xây dựng có mục đích cho các ứng dụng biên, nghĩa là nó được thiết kế để chạy trên phần cứng hạn chế ở xa trung tâm dữ liệu.
VLM kết hợp sự hiểu biết theo ngữ cảnh của các mô hình ngôn ngữ lớn với khả năng phân tích hình ảnh: các nhà nghiên cứu yêu cầu mô hình phân loại dữ liệu cảm biến nơi môi trường tự nhiên đáp ứng sự phát triển của con người, hoặc để xác định cơ sở hạ tầng xung quanh các trung tâm đường sắt, và nó đã làm được điều đó.
Cuộc biểu tình có ý nghĩa quan trọng vì hai lý do. Trong thời gian tới, nó có thể làm cho các cảm biến không gian trở nên hữu ích hơn nhiều bằng cách thực hiện phân loại dữ liệu ban đầu trên quỹ đạo, giảm lượng dữ liệu thô mà các nhà phân tích hiện phải xử lý.
Về lâu dài, đó là bằng chứng cho việc vận hành cơ sở hạ tầng AI quy mô lớn hơn trong không gian. Paul Lasserre, người đứng đầu bộ phận AI của Loft, nói với TechCrunch: “Nó mở ra cánh cửa cho các lớp tuần tra luôn hoạt động trong không gian”.
“Nếu bạn có VLM, bạn có thể có logic—chẳng hạn như ‘giám sát đường viền này cho tôi và cho tôi biết khi có điều gì đó đáng ngờ’ và tương tác qua lại với các vệ tinh.” Tàu vũ trụ của Loft được thiết kế làm nền tảng cho khách hàng bên thứ ba.
Mô hình kinh doanh gần với cơ sở hạ tầng như một dịch vụ hơn là sản xuất vệ tinh truyền thống. Một thỏa thuận gần đây cho thấy họ xây dựng, phóng và vận hành sáu vệ tinh mới cho EarthDaily, vệ tinh này sẽ phân tích và tiếp thị dữ liệu được thu thập trên tàu vũ trụ.
Yam-9 được ra mắt vào mùa thu năm 2025 với vai trò là người mở đường cho các dự án AI trên quỹ đạo của công ty và bao gồm GPU Nvidia Jetson Orrin AGX, một trong những chip hàng đầu được sử dụng trong điện toán không gian.
Juan Deffa Victoria, lãnh đạo kỹ thuật trong nhóm AI của NASA JPL, đã lãnh đạo việc phát triển NAVI-Orbital, một gói phần mềm có tác dụng khai thác hiệu quả cho Gemma 3 VLM.
Trong khi Gemma 3 sắp ra mắt, các kỹ sư phần mềm đã phải sắp xếp hợp lý gói phần mềm để giảm số lượng thư viện và bộ nhớ mà nó yêu cầu. Mặc dù đây là lần đầu tiên sử dụng VLM trên quỹ đạo được báo cáo nhưng chúng ta có thể mong đợi các công ty khác sẽ làm theo.
Planet Labs bay vệ tinh với bộ xử lý Jetson Orin; hiện tại, họ đang sử dụng chúng cho các nhiệm vụ phát hiện đối tượng đơn giản hơn, nhưng người phát ngôn cho biết nghiên cứu đang được tiến hành trên các ứng dụng AI khác, bao gồm cả VLM.
Kepler Communications, công ty vận hành nhóm GPUS lớn nhất trong không gian, từ chối cho biết liệu họ có triển khai VLM trong không gian hay không do các thỏa thuận NDA với các đối tác, nhưng lưu ý rằng đã có “một số trường hợp sử dụng không được tiết lộ trong môi trường điện toán của chúng tôi” kể từ khi những tàu vũ trụ đó ra mắt vào tháng 1.
Lasserre nói: “Bây giờ chúng tôi đã chứng minh được khái niệm này, đó thực sự là hướng đi”. Mục tiêu là xây dựng chòm sao để đảm bảo phạm vi phủ sóng theo thời gian thực tới mọi nơi trên Trái đất, mà theo ông sẽ có khoảng từ 50 đến 100 vệ tinh như Yam-9.
(Loft hiện đang vận hành 12 spacecra ft trên quỹ đạo.) Bài học rút ra khi triển khai các mô hình nhỏ hơn này trên quỹ đạo sẽ cho biết cách các công ty cố gắng triển khai cơ sở hạ tầng điện toán quy mô lớn hơn trong không gian, đặc biệt là trong các lĩnh vực tầm thường nhưng quan trọng là quản lý năng lượng và bộ nhớ.
Chúng cũng có thể mở đường cho những công cụ khoa học mới. Ý tưởng về NAVI-Space bắt đầu với Nhà nghiên cứu JPL Taran Cyriac John, người đang nghĩ đến trợ lý kỹ thuật số cho các phi hành gia khám phá Mặt trăng hoặc Sao Hỏa.
“Chúng tôi đang nghĩ, được thôi, bạn có các phi hành gia với bộ đồ điều áp và bạn biết họ không thể gõ bàn phím, bất cứ điều gì họ muốn làm đều phức tạp.” Delfa Victoria nói.
“Vậy, sao chúng ta không cung cấp một trợ lý, giống như trong trò chơi điện tử và trong phim, nơi bạn thấy AI có khả năng tương tác?” Khi bạn mua hàng thông qua các liên kết trong bài viết của chúng tôi, chúng tôi có thể kiếm được một khoản hoa hồng nhỏ.
Điều này không ảnh hưởng đến tính độc lập biên tập của chúng tôi. Tìm hiểu sâu hơn về những yếu tố cần thiết để mở rộng quy mô và thành công từ các nhà lãnh đạo tại Mach Industries, Founders Fund và Shinkei Systems.
Thông qua các cuộc trò chuyện thẳng thắn bên lò sưởi và kết nối mạng có tác động cao, bạn sẽ có được những hiểu biết sâu sắc có giá trị và các kết nối mới. FBI đã xây dựng thị trấn nhỏ bản sao của riêng mình để mô phỏng các cuộc tấn công mạng tr...
Đơn vị AI vài tháng tuổi của ttaker Meta là một gulag tan nát tâm hồn, các kỹ sư bị mắc kẹt bên trong nó Connie Loizos Prometheus của Jeff Bezos huy động được 12 tỷ USD để xây dựng một 'kỹ sư tổng hợp nhân tạo' cho thế giới vật chất Marina Temkin
Gợi ý thực hành:
1. Theo dõi thông báo từ cơ quan địa phương tại California.
2. Kiểm tra nguồn chính thức trước khi chia sẻ lại thông tin.