AI phát hiện và cảnh báo nguy cơ mất an toàn ở công trường

Công cụ Safety AI có thể phát hiện vi phạm an toàn với độ chính xác 95%. Ảnh: DroneDeploy

Theo MIT Technology Review, hơn 1.000 công nhân xây dựng tử vong mỗi năm tại Mỹ, khiến ngành xây dựng trở thành ngành công nghiệp nguy hiểm nhất với các tai nạn trượt ngã chết người. Để đối phó với những hành vi bất cẩn và mạo hiểm, Philip Lorenzo, doanh nhân kiêm giám đốc điều hành công ty DroneDeploy có trụ sở tại San Francisco, đã phát triển công cụ mang tên Safety AI giúp phát hiện dấu hiệu vi phạm quy định của Cơ quan Quản lý An toàn và Sức khỏe Nghề nghiệp (OSHA). Công cụ sử dụng AI phân tích hình ảnh thu thập thực tế hàng ngày và đưa ra cảnh báo, độ chính xác lên tới 95%.

Ra mắt vào tháng 10/2024, hiện nay, Safety AI đang được sử dụng tại hàng trăm công trường xây dựng ở Mỹ và các phiên bản dành riêng cho quy định xây dựng ở Canada, Anh, Hàn Quốc và Australia cũng đã được triển khai.

Safety AI là một trong nhiều công cụ an toàn xây dựng AI xuất hiện trong những năm gần đây, từ Thung lũng Silicon đến Hong Kong và Jerusalem. Theo Lorenzo, Safety AI là công cụ đầu tiên sử dụng AI tạo sinh để đánh dấu vi phạm an toàn và thuật toán có thể làm nhiều hơn ngoài nhận diện đối tượng như thang hoặc mũ bảo hộ. Phần mềm có thể “suy luận” những gì đang diễn ra trong hình ảnh của công trường và đưa ra kết luận có xảy ra vi phạm OSHA hay không. Hình thức phân tích này tiên tiến hơn so với phát hiện vật thể. Nhưng với tỷ lệ thành công 95%, Safety AI không hoàn hảo và toàn năng mà cần chuyên viên an toàn có kinh nghiệm giám sát.

Robot và AI thường hoạt động tốt trong môi trường tĩnh dễ kiểm soát như sàn nhà máy hoặc bến cảng. Nhưng công trường xây dựng luôn thay đổi mỗi ngày. Lorenzo xây dựng phương pháp tốt hơn để giám sát công trường, sử dụng loại AI tạo sinh gọi là mô hình ngôn ngữ hình ảnh (VLM). Một VLM là một mô hình ngôn ngữ lớn (LLM) với bộ mã hóa hình ảnh, cho phép nó “nhìn” thấy hình ảnh và phân tích những gì đang diễn ra trong khung cảnh.

Sử dụng hình ảnh thu thập thực tế từ khách hàng trong nhiều năm, nhóm của Lorenzo tập hợp một “bộ dữ liệu vàng” bao gồm hàng chục nghìn ảnh chụp vi phạm OSHA. Để huấn luyện mô hình, Lorenzo có một nhóm nhỏ chuyên gia an toàn xây dựng đặt ra những câu hỏi mấu chốt cho AI.

Huấn luyện viên nạp ảnh thử nghiệm từ bộ dữ liệu vào VLM và đặt câu hỏi hướng dẫn mô hình qua quá trình phân tích cảnh tượng theo từng bước như con người. Nếu VLM không đưa ra phản hồi chính xác, ví dụ bỏ sót một vi phạm hoặc ghi nhận kết quả dương tính giả, huấn luyện viên sẽ quay lại và điều chỉnh gợi ý hoặc thông tin đầu vào.

Theo Lorenzo, thay vì chỉ học cách nhận diện vật thể, VLM được dạy “cách suy nghĩ theo hướng nhất định”, từ đó rút ra kết luận về những gì đang xảy ra trong hình ảnh. Lorenzo cho biết VLM tốt hơn nhiều so với các phương pháp cũ trong phân tích hoạt động sử dụng thang, nguyên nhân của 24% số ca tử vong do ngã trong ngành xây dựng.

Sử dụng mô hình ngôn ngữ hình ảnh cho AI xây dựng có nhiều tiềm năng, nhưng vẫn có “một số vấn đề cơ bản” cần giải quyết, bao gồm ảo giác và trường hợp ngoại lệ mà VLM chưa được huấn luyện. Lorenzo thừa nhận LLM có “một số sai sót lớn và gặp khó khăn với suy luận không gian. Vì vậy, Safety AI sử dụng một số phương pháp học máy cũ hơn để tạo ra mô hình không gian của công trường xây dựng, bao gồm phân đoạn hình ảnh thành các phần quan trọng và kỹ thuật đo ảnh, tạo mô hình 3D kỹ thuật số từ hình ảnh 2D. Safety AI cũng được đào tạo kỹ lưỡng trong 10 vùng vấn đề khác nhau như sử dụng thang để dự đoán những vi phạm phổ biến nhất. Dù vậy, Lorenzo thừa nhận có một số trường hợp ngoại lệ mà LLM sẽ không thể nhận biết.

Aaron Tan, một quản lý dự án bê tông tại khu vực Vịnh San Francisco, cho biết công cụ như Safety AI có thể hữu ích đối với nhà quản lý an toàn, giúp tiết kiệm nhiều thời gian nếu họ có thể nhận cảnh báo qua email thay vì phải lái xe hai tiếng tới công trường.

An Khang (Theo MIT Technology Review)

Nguồn bài viết : https://vnexpress.net/ai-phat-hien-va-canh-bao-nguy-co-mat-an-toan-o-cong-truong-4909428.html