When Dominance Falters: H1-H4 가설 검증 방법론 요약
"When Dominance Falters" 보고서에 사용된 핵심 가설(H1-H4)의 검증 방법론, 선택 이유, 그리고 결과의 의미를 정리한 문서입니다.
- 방법론: 맨-휘트니 U 검정 (Mann-Whitney U test)
- 설명: 두 독립적인 집단의 데이터 분포가 동일한지 여부를 확인하는 비모수적 통계 검정입니다. 데이터가 정규분포를 따르지 않을 때 유용합니다.
- 선택 이유: '통합 제조사'와 '모듈러 통합자'라는 두 집단의 성과(PointsShare) 중앙값을 비교하기 위함입니다. F1 데이터는 소수의 상위 팀이 성과를 독식하여 정규분포를 따르지 않을 가능성이 높으므로, 비모수적 검정인 맨-휘트니 U 검정이 더 강건하고 적합합니다.
- 결과 의미 (p=0.0005): p-value가 0.01보다 매우 낮으므로, 두 집단 간의 성과 차이는 통계적으로 매우 유의미합니다. 이는 통합 제조사가 DFV 시대 이전에 모듈러 통합자들보다 월등히 높은 성과를 거두었다는 가설을 강력하게 뒷받침합니다. 즉, 당시의 지배 구조가 실제로 존재했음을 증명합니다.
- 방법론: 웰치의 t-검정 (Welch's t-test)
- 설명: 두 집단의 평균이 다른지를 비교하는 통계 검정입니다. 특히 두 집단의 분산이 다를 때 사용됩니다.
- 선택 이유: DFV 도입 이전과 이후, '통합 제조사'라는 동일 집단의 성과 평균을 비교하기 위해 사용되었습니다. 두 기간의 성과 분산이 다를 수 있다는 점을 고려하여(H3에서 실제로 증명됨), 분산이 같다고 가정하지 않는 웰치의 t-검정을 선택했습니다.
- 결과 의미 (p=0.094): p-value가 0.05보다는 크지만 0.1보다는 작아 '한계적으로 유의미하다(marginally significant)'고 해석됩니다. 이는 통합 제조사의 성과 하락이 통계적으로 명확하지는 않지만, 무시할 수 없는 수준의 감소 경향이 있음을 시사합니다. 성과가 26.6% 감소했다는 실질적인 크기와 함께 고려할 때, 가설이 부분적으로 지지된다고 볼 수 있습니다.
- 방법론: 레빈 검정 (Levene's test)
- 설명: 두 개 이상의 집단 간 분산이 동일한지 여부를 검정하는 방법입니다. 평균이 아닌 중앙값을 사용하여 이상치(outlier)에 덜 민감한 장점이 있습니다.
- 선택 이유: DFV 도입 이전과 이후의 '성과 분산(variance)' 자체를 비교하는 것이 가설의 핵심이기 때문입니다. 레빈 검정은 두 기간 동안 팀들의 성과가 더 널리 퍼져 있었는지, 아니면 더 촘촘하게 모여 있었는지를 통계적으로 검증하는 데 가장 직접적인 방법입니다.
- 결과 의미 (p=0.013): p-value가 0.05보다 작으므로, 두 기간의 성과 분산이 다르다는 것이 통계적으로 유의미합니다. 구체적으로 DFV 시대의 분산이 35% 감소했는데, 이는 DFV 엔진이 일종의 '성능 평준화' 효과를 가져와 팀들 간의 격차를 줄이고 경쟁을 더 압축시켰음을 의미합니다.
- 방법론: 카이제곱 검정 (Chi-Square test)
- 설명: 두 범주형 변수 간의 연관성을 검정하는 데 사용됩니다. 관찰된 빈도가 기대 빈도와 얼마나 다른지를 측정합니다.
- 선택 이유: '팀 유형(통합 제조사 vs 모듈러 통합자)'과 'DFV 채택 여부(채택 vs 비채택)'라는 두 개의 명목 변수 간의 관계를 분석하는 데 가장 적합한 방법입니다. 이 검정을 통해 통합 제조사들이 다른 팀들에 비해 DFV 엔진을 의도적으로 덜 채택했는지 통계적으로 확인할 수 있습니다.
- 결과 의미 (p<0.0001): p-value가 극도로 낮아, 팀 유형과 DFV 채택 여부 사이에 매우 강력한 통계적 연관성이 있음을 나타냅니다. 실제로 통합 제조사의 DFV 채택률은 0%였던 반면, 모듈러 통합자는 90%에 달했습니다. 이는 통합 제조사들이 기술적 우위가 명확했음에도 불구하고 의도적으로 DFV 엔진을 외면했다는 '적응 실패' 가설을 결정적으로 증명합니다.