p-값

p값과 관련한 문제에는 방법적인 서투름의 문제를 넘어 (물론 방법론적인 문제도 많지만) 연구자들이 다루는 변수들의 설명력은 약하고 데이터의 양은 부족하다는 점에서 기인하는 것일 것이다. 물론 베이지안 통계를 동원하면 그런 부족함에서 기인하는 불확실성을 보다 솔직하게 보여줄 수는 있겠지만 그렇다고 연구자들이 처한 상황이 아주 나아지는 것은 아닐 것이다. (물론 여전히 장족의 발전이긴 하다.)

분산 설명량이 10% 정도 밖에 안 되는 모형이 등장하는 논문이 얼마나 많은가? 보다 정확한 방법을 사용한다면, 예를 들어 cross-validation이라도 수행한다면 기대할 수 있는 분산 설명량은 더 낮아질 것이다. 거기에 모델의 총합이 아니라 연구자들이 관심을 가지는 변수 하나의 중요성과 설명 능력은 대체 얼마나 될까? 물론 분산 설명량이 낮다고 모델이 유용하지 않은 것은 아니지만 그렇게 말하는 순간에도 나머지 90%의 분산이라는 블랙박스는 설명되지 못했다는 것과 그 90%를 설명하는 변수가 반영되는 순간 연구자들이 관심을 보이는 변수를 미미한 것이 되어버릴 수 있다는 것을 고려해야 한다.

그러니 p값과 관련된 난국은 연구자들이 처한 상황, 갈수록 세부적인 것들과 생각하지 못했던 효과를 보고해야 하는 동시에 충분한 데이터를 수집할 수는 없는 상황과 떼어놓을 수 없다고 본다. 과학적 진전을 이룰 수 있는 충분히 신뢰롭고 좋은 연구 결과가 기대되는 동시에 그러기 위한 조건들과 방법들은 점점 더 어려워지고. 어쩔 수 없이 난국이라고 부를 수밖에 없을 듯하다.

p-값

Kim Seonghyeon

Posts

클레르 옵스퀴르: 33 원정대

Scaling Law, Architecture for Stability and Layer Stacking

Preliminary Explorations on UL2 and Second-order Optimizers

Constitutional AI

이미지와 텍스트 생성 모델에 대해

언어의 손실 압축에 대하여

OCR 회고

텔 아비브와 ECCV 2022 여행기 7

텔 아비브와 ECCV 2022 여행기 6