스마트 안전관리
건설현장 AI CCTV, 알림만 쏟아지던 시대는 끝났다… 엣지 AI와 VLM으로 '진화'
이 글은 '건설업 인력 감소와 산재 증가, 현장 AI가 대안이 될 수 있을까?'의 후속 편입니다. 지난 글에서 건설 인력 감소와 산재 증가라는 두 가지 흐름 속에서, 현장 AI가 감시의 범위를 넓히는 현실적인 대안이 될 수 있다는 이야기를 했습니다.
그리고 "교체가 아닌 연결, 클라우드가 아닌 현장 처리"라는 발상의 전환이 현장을 바꾸고 있다고 말씀드렸는데요. 오늘은 그 이야기를 풀어보겠습니다.
건설사들이 AI 카드를 꺼내든 이유
최근 건설업계의 움직임이 심상치 않습니다. 대우건설은 안전·AI 혁신 스타트업을 발굴하는 오픈 이노베이션을 개최했고, 포스코이앤씨는 AI·로봇·드론으로 현장 안전망 혁신을 선언했습니다. SK에코플랜트는 구성원이 직접 AI 에이전트를 기획·개발하는 체제로 전환했고, 호반그룹도 혁신기술공모전을 열어 AI·로봇·에너지 신기술을 찾고 있습니다.
건설업 종사자 수는 줄어들고, 사고 사망자는 증가한다
지난 글에서 다뤘듯이, 건설업 종사자 수는 21개월째 감소하고 있고, 안전 기준은 갈수록 높아지고 있습니다. 이 격차를 메울 수 있는 기술로 대형 건설사들이 일제히 AI를 선택하기 시작한 것입니다.
그런데 "AI를 도입한다"는 말이 실제 현장에서는 어떤 의미일까요?
기존 AI CCTV의 한계 - 왜 현장에서 외면받았나
AI CCTV가 처음 등장한 건 몇 년 전입니다. 하지만 초기 도입 현장에서의 반응은 냉담했습니다. 이유는 크게 세 가지였습니다.
첫째, 기존 카메라를 전면 교체해야 했습니다. AI 분석이 가능한 전용 카메라로 바꿔야 했기 때문에, 현장 전체의 CCTV를 교체하는 비용이 진입 장벽이었습니다.
둘째, 영상을 외부 서버로 보내야 했습니다. 서버 기반 AI는 현장 영상을 클라우드로 전송해서 분석하는 구조입니다. 통신 환경이 불안정한 건설현장에서는 지연이 발생하고, 보안에 민감한 발주처에서는 원본 영상의 외부 전송 자체를 꺼리는 경우가 많았습니다.
셋째, 오탐이 너무 잦았습니다. 범용 AI 모델은 건설현장의 다양한 환경인 분진, 역광, 비, 야간, 공종 변화 에 대응하지 못했습니다. 알림이 너무 자주, 부정확하게 울리니까 안전관리자들이 결국 AI 경고를 무시하는 악순환이 벌어졌습니다.
결국 "AI를 깔았는데 안 쓰게 됐다"는 현장이 적지 않았습니다.
발상의 전환 - 교체가 아닌 연결
엣지 AI CCTV는 이 세 가지 문제를 구조적으로 해결합니다.
카스웍스 엣지 AI CCTV는 기존 카메라 그대로를 활용할 수 있다
카메라를 교체하지 않습니다. 이미 현장에 설치된 IP 카메라의 영상을 RTSP 프로토콜로 수신하기만 하면 됩니다. 엣지 AI 디바이스를 기존 카메라에 연결하는 것만으로 AI 안전관리가 시작됩니다. 카메라를 바꿀 필요도, VMS를 변경할 필요도 없습니다.
영상을 외부로 보내지 않습니다. AI 추론이 현장의 엣지 디바이스에서 직접 이루어집니다. 원본 영상은 디바이스에 로컬 저장되며 외부로 전송되지 않습니다. 외부로 나가는 건 감지 이벤트의 이미지 컷과 분석 결과뿐이고, 그것도 암호화된 채널을 통해서만 전달됩니다.
이 구조가 왜 중요하냐면, 발주처와 수요기업의 보안 우려를 근본적으로 해소하기 때문입니다. 원본 영상이 현장을 떠나지 않는다는 것은, 보안 심사에서 가장 까다로운 부분을 통과할 수 있다는 뜻입니다.
단일 감지를 넘어 - VLM이 "상황"을 이해한다
엣지 디바이스가 해결하는 건 "실시간 감지"입니다. 안전모 미착용, 중장비 접근, 화재 등 단일 이벤트를 현장에서 즉시 잡아냅니다.
하지만 실제 사고로 이어지는 상황은 훨씬 복합적입니다.
"안전모를 쓰지 않은 작업자가 굴착기 작업반경 안에 들어갔다"
이건 안전모 미착용과 중장비 접근이 동시에 발생한 복합 위험 상황입니다. 기존 AI는 각각을 따로 감지할 수는 있지만, 이 둘이 결합되었을 때의 위험도를 판단하지는 못했습니다.
건설현장에 본격적으로 AI와 VLM이 도입될 수 있는 기반이 마련됐다
여기서 VLM(Vision Language Model)이 등장합니다. 엣지 디바이스가 1차로 위험 이벤트를 감지하면, 해당 영상을 서버의 VLM이 2차로 분석합니다. VLM은 영상 속 상황을 자연어로 설명하고, 복합 위험도를 추론하며, 조치내용까지 자동으로 생성합니다.
"현장 2공구 C구역에서 5명의 작업자가 작업 중이며, 한 명은 우측에서 굴착기 근처에서 작업하고 있고 다른 한 명은 부분적으로 안전모를 쓰지 않은 것으로 보입니다. 현장 백인은 가설 배전을 설치하며 있었고 사다리를 좁은 곳으로 짊어 옮기고 있습니다."
이것은 실제 VLM 분석 결과의 예시입니다. 단순히 "안전모 미착용"이라고 알려주는 게 아니라, 현장 상황 전체를 맥락적으로 설명하고 기록합니다.
감지에서 끝나지 않는다 - 귀찮은 보고서까지!
기존 AI CCTV의 또 다른 문제는 "감지하고 알림을 보내는 것"에서 끝난다는 점이었습니다. 알림을 받은 안전관리자가 직접 확인하고, 수기로 기록하고, 보고서를 작성해야 했습니다.
위험 감지와 조치사항을 모두 기록하고, 엑셀로 다운 받을 수 있다
엣지 AI + VLM 하이브리드 구조에서는 이 과정이 자동화됩니다.
감지된 이벤트는 VLM이 분석하여 상황 설명과 조치내용이 포함된 보고서를 자동으로 생성합니다. 원하는 기간을 설정해 안전 분석 보고서가 만들어집니다.
감지 → 분석 → 보고서. 이 흐름이 사람의 개입 없이 돌아가는 것이 핵심입니다.
경험이 정확도를 만든다
기술은 중요하지만, 건설현장 AI에서 진짜 차이를 만드는 건 현장 경험입니다.
건설현장은 제조 공장과 다릅니다. 공사 단계마다 환경이 바뀌고, 계절과 시간대에 따라 영상 조건이 달라집니다. 한여름 콘크리트 타설 현장과 겨울 철골 작업 현장은 같은 카메라로 찍어도 완전히 다른 영상이 됩니다. 이런 다양한 환경에서 정확하게 동작하려면 건설현장에 특화된 AI 모델이 필요합니다.
4,600개 공사현장, 제조현장의 노하우가 담긴 엣지 AI CCTV
카스웍스는 전국 4,600개가 넘는 건설현장에서 CCTV·AI 안전관리 플랫폼을 운영하며 5년간 현장의 니즈를 반영해왔습니다. 안전모 미착용, 중장비 접근, 화재, 쓰레기, 작업자 위치 등 8종의 건설현장 특화 감지 모델을 개발했고, 현재 VLM 기반 복합위험 분석까지 현장에 적용하고 있습니다.
지금이 시작할 때입니다
지난 글에서 말씀드렸듯이, 2026년부터 스마트 안전장비 비용이 산업안전보건관리비에서 100% 계상 가능해졌습니다. 비용의 벽이 낮아진 지금, 기존 카메라를 교체하지 않고 엣지 디바이스 하나로 AI 안전관리를 시작할 수 있습니다.
사람의 눈이 닿지 않는 곳을 AI가 대신 지켜봅니다. 교체가 아닌 연결로, 클라우드가 아닌 현장에서.
참고 기사
__210.jpg)
글쓴이 | 전성환 (주)아이콘 이사
프롭테크 전문 언론인에서 콘테크 전문가로 전향해 산업의 혁신을 돕고 있습니다. 2020년부터 (주)아이콘의 건설현장 AI·안전 플랫폼 '카스웍스'를 서비스하며 현장에 남은 아날로그적 비효율을 기술로 해결해 나가는 중입니다. 나아가 건설을 넘어 다양한 산업 현장의 생산성과 효율성을 높이는 DX와 AX를 주도하고 있습니다.




