AI가 골프 스윙을 분석하는 원리 (컴퓨터 비전과 딥러닝)

Good Swing AI가 사용자 여러분의 스윙 영상을 보고 "헤드업을 했습니다", "치킨윙이 발생했습니다"라고 진단할 수 있는 것은 마법이 아닙니다. 그 뒤에는 고도화된 컴퓨터 비전(Computer Vision) 기술과 딥러닝(Deep Learning) 모델이 작동하고 있습니다.

1단계: 관절 추적 (Pose Estimation)

첫 번째 단계는 영상 속에서 사람을 찾고, 그 사람의 관절 위치를 파악하는 것입니다. Good Swing AI는 구글의 미디어파이프(MediaPipe)와 자체 개발한 튜닝 모델을 사용하여 신체의 33개 핵심 키포인트(Keypoints)를 3차원 공간 좌표(x, y, z)로 추출합니다.

어깨, 팔꿈치, 손목, 골반, 무릎, 발목 등의 위치를 초당 30~60회 추적하여 움직임의 궤적을 그려냅니다.

[입력 영상] ➔ [CNN 모델] ➔ [히트맵(Heatmap) 생성] ➔ [33개 관절 좌표 추출]

2단계: 동작 구간 분할 (Segmentation)

관절의 움직임 데이터가 확보되면, AI는 이 움직임이 스윙의 어느 단계에 해당하는지 판단합니다. 예를 들어, 손이 가장 높이 올라갔을 때를 '백스윙 탑', 클럽 헤드의 속도가 가장 빠르고 공과 만나는 시점을 '임팩트'로 인식합니다.

RNN(Recurrent Neural Network) 기반의 시계열 분석 모델이 스윙의 7단계(어드레스 ~ 피니시)를 정확하게 잘라냅니다.

3단계: 문제점 진단 (Diagnosis)

마지막으로, 추출된 데이터와 프로 선수들의 이상적인 데이터(Ground Truth)를 비교합니다.

백스윙 시 머리의 Y좌표 변화량이 일정 수준을 넘으면 ➔ "헤드업 경고"
임팩트 시 왼팔의 각도가 굽혀져 있으면 ➔ "치킨윙 경고"

이 과정은 수많은 레슨 프로들의 노하우를 알고리즘화한 '전문가 시스템(Expert System)'에 의해 수행됩니다.

이 모든 과정이 사용자가 영상을 올리는 즉시, 단 몇 초 만에 이루어집니다.

내 스윙 분석해보기