AI outperforms doctors in Harvard trial...

Các nhà nghiên cứu cho biết kết quả đánh dấu một 'sự thay đổi sâu sắc trong công nghệ sẽ định hình lại y học' Từ George Clooney trong phòng cấp cứu đến Noah Wyle trong The Pitt, các bác sĩ khoa cấp cứu từ lâu đã trở thành những anh hùng được nhiều người yêu mến. Nhưng liệu đã đến lúc phải treo khăn lau lên chưa? Một nghiên cứu đột phá của Harvard đã phát hiện ra rằng hệ thống AI hoạt động tốt hơn các bác sĩ con người trong việc phân loại thuốc cấp cứu áp suất cao, chẩn đoán chính xác hơn trong những khoảnh khắc có thể xảy ra sự sống và cái chết khi mọi người lần đầu tiên được đưa đến bệnh viện. Các kết quả được các chuyên gia độc lập mô tả là cho thấy “một bước tiến thực sự” trong lý luận lâm sàng của AI và là một phần của các thử nghiệm kiểm tra phản ứng của hàng trăm bác sĩ chống lại AI. Các tác giả cho biết kết quả được công bố trên tạp chí Science cho thấy các mô hình ngôn ngữ lớn (LLM) “đã làm lu mờ hầu hết các tiêu chuẩn về lý luận lâm sàng”. Một thí nghiệm tập trung vào 76 bệnh nhân đến phòng cấp cứu của bệnh viện Boston. Mỗi AI và một cặp bác sĩ con người được cung cấp cùng một hồ sơ sức khỏe điện tử tiêu chuẩn để đọc – thường bao gồm dữ liệu dấu hiệu quan trọng, thông tin nhân khẩu học và một vài câu của y tá về lý do bệnh nhân đến đó. AI đã xác định được chẩn đoán chính xác hoặc rất gần trong 67% trường hợp, đánh bại các bác sĩ con người, những người chỉ đúng 50% -55%. Nó cho thấy lợi thế của AI đặc biệt rõ rệt trong các trường hợp phân loại đòi hỏi phải đưa ra quyết định nhanh chóng với lượng thông tin tối thiểu. Độ chính xác chẩn đoán của AI – mô hình lý luận o1 của OpenAI – đã tăng lên 82% khi có thêm chi tiết, so với độ chính xác 70-79% mà các chuyên gia đạt được, mặc dù sự khác biệt này không có ý nghĩa thống kê. Nó cũng hoạt động tốt hơn một nhóm bác sĩ lớn hơn khi được yêu cầu cung cấp các kế hoạch điều trị dài hạn hơn, chẳng hạn như cung cấp chế độ kháng sinh hoặc lập kế hoạch cho các quá trình cuối đời. AI và 46 bác sĩ được yêu cầu kiểm tra 5 nghiên cứu điển hình lâm sàng và máy tính đưa ra các kế hoạch tốt hơn đáng kể, đạt 89% so với 34% đối với con người sử dụng các tài nguyên thông thường, chẳng hạn như công cụ tìm kiếm. Nhưng các nhà nghiên cứu cho biết, đây vẫn chưa phải là màn che cho các bác sĩ cấp cứu. Nghiên cứu chỉ thử nghiệm con người với AI xem dữ liệu bệnh nhân có thể được truyền đạt qua văn bản. Việc đọc các tín hiệu của AI, chẳng hạn như mức độ đau khổ của bệnh nhân và hình ảnh trực quan của họ, chưa được kiểm tra. Điều đó có nghĩa là AI đã hoạt động tốt hơn giống như một bác sĩ lâm sàng đưa ra ý kiến thứ hai dựa trên giấy tờ. Arjun Manrai, một trong những tác giả chính của nghiên cứu, người đứng đầu phòng thí nghiệm AI tại Trường Y Harvard, cho biết: “Tôi không nghĩ những phát hiện của chúng tôi có nghĩa là AI sẽ thay thế bác sĩ”. “Tôi nghĩ điều đó có nghĩa là chúng ta đang chứng kiến một sự thay đổi thực sự sâu sắc trong công nghệ sẽ định hình lại y học.” Tiến sĩ Adam Rodman, một tác giả chính khác và là bác sĩ tại trung tâm y tế Beth Israel Deaconess ở Boston, nơi nghiên cứu diễn ra, cho biết AI LLM là một trong những “công nghệ có tác động mạnh nhất trong nhiều thập kỷ”. Ông cho biết, trong thập kỷ tiếp theo, AI sẽ không thay thế các bác sĩ mà sẽ tham gia cùng họ trong một “mô hình chăm sóc ba bên… bác sĩ, bệnh nhân và hệ thống trí tuệ nhân tạo”. Trong một trường hợp trong nghiên cứu của Harvard, một bệnh nhân có cục máu đông ở phổi và các triệu chứng ngày càng trầm trọng hơn. Các bác sĩ cho rằng thuốc chống đông máu đã thất bại, nhưng AI nhận thấy một điều mà con người không nhận thấy: tiền sử bệnh lupus của bệnh nhân có nghĩa là điều này có thể gây ra tình trạng viêm phổi. AI đã được chứng minh là đúng. Theo nghiên cứu được công bố vào tháng trước, gần 1/5 bác sĩ Hoa Kỳ đã sử dụng AI để hỗ trợ chẩn đoán. Ở Anh, 16% bác sĩ đang sử dụng tec h hàng ngày và thêm 15% hàng tuần, trong đó “ra quyết định lâm sàng” là một trong những mục đích sử dụng phổ biến nhất, theo một cuộc khảo sát gần đây của Đại học Bác sĩ Hoàng gia. Mối lo ngại lớn nhất của các bác sĩ Vương quốc Anh là lỗi AI và rủi ro trách nhiệm pháp lý. Hàng tỷ USD đang được đầu tư vào các công ty chăm sóc sức khỏe AI, nhưng vẫn còn câu hỏi về hậu quả của lỗi AI. Rodman cho biết: “Hiện tại không có khuôn khổ chính thức nào cho trách nhiệm giải trình”, ông cũng nhấn mạnh rằng bệnh nhân cuối cùng “muốn con người hướng dẫn họ vượt qua các quyết định sống hay chết [và] hướng dẫn họ vượt qua các quyết định điều trị đầy thách thức”. Giáo sư Ewen Harrison, đồng giám đốc trung tâm tin học y tế của Đại học Edinburgh, cho biết nghiên cứu này rất quan trọng và cho thấy "các hệ thống này không còn chỉ giúp vượt qua các bài kiểm tra y tế hay giải quyết các trường hợp xét nghiệm nhân tạo. Chúng bắt đầu giống như những công cụ hữu ích cho các bác sĩ lâm sàng, đặc biệt khi điều quan trọng là phải xem xét phạm vi rộng hơn các chẩn đoán có thể có và tránh bỏ lỡ điều gì đó quan trọng". Tiến sĩ Wei Xing, trợ lý giáo sư tại trường khoa học vật lý và toán học của Đại học Sheffield, cho biết một số phát hiện khác cho thấy các bác sĩ có thể trì hoãn một cách vô thức. e Câu trả lời của AI thay vì suy nghĩ độc lập. Ông nói: “Xu hướng này có thể ngày càng trở nên quan trọng hơn khi AI ngày càng được sử dụng thường xuyên hơn trong môi trường lâm sàng”. Ông cũng nhấn mạnh việc thiếu thông tin về bệnh nhân nào mà AI chẩn đoán kém hơn và liệu AI có gặp khó khăn nhiều hơn với bệnh nhân lớn tuổi hay không nói tiếng Anh hay không. Gợi ý thực hành: 1. Theo dõi thông báo từ cơ quan địa phương tại California. 2. Kiểm tra nguồn chính thức trước khi chia sẻ lại thông tin.

AI vượt trội hơn các bác sĩ trong thử nghiệm chẩn đoán phân loại khẩn cấp của Harvard