사회학하면 어쩐지 거대한 이론과 담론들로 대표되는 것 같다. 실제로 그게 주요한 사회학의 전통이라고 해도 크게 틀리지는 않을 것이다. 그와는 좀 다른 전통이 있는데 그 …

K값 논란

노령인구 비율과 미분류비율로 그린 산포도인데 상당히 강한 선형입니다. 툭 튀어나와있는 점은 세종시인데 세종시는 아웃라이어라고 볼 수 있겠죠. 그래서 분석에서 일 …

모래더미 모형이라고 마크 뷰캐넌이 자주 써먹는 모형이 있다. 복잡한 모형은 아니다. 평평한 평면 위 어느 한 곳에 모래를 하나 떨어뜨린다고 하자. 똑같은 곳에 모래가 또 …

빅 데이터

잘 아는 것은 아니지만 빅 데이터가 뭔가 생각해보면…빅 데이터라고 할 때 데이터를 분석하는 방법 자체는 다 기존의 통계, 머신 러닝, IR에서 왔다고 할 …

batch normalization의 문제 의식은 뉴럴넷에서 하나의 레이어의 출력은 이전의 레이어의 출력에 의해 영향을 받기에, 깊은 뉴럴넷에서는 이런 &ldquo …

Watts가 Turco & Zuckerman이 쓴 비판에 대한 대응으로 쓴 Response to Turco and Zuckerman’s “Versthen for Sociology"라는 글에서 나온 예시 중에 이런 게 있음. 비틀 …

전통적 통계적 모델링의 대상인 표 형태의 데이터tabular data에 대해서는 딥 러닝이 힘을 못 쓴다(?)는 말을 흔히 한다. 사실 이건 딥 러닝이 이미지나 텍스 …

Breiman이 Statistical Modeling: The Two Cultures에서 보여줬던 것처럼 통계적 모델링에는 대체로 두 가지 경로가 있다. 하나는 데이터의 생성 과정을 기술하여 데이터를 모 …

과학의 충분조건을 제안하기는 어려운 일이지만 과학의 필요조건을 선정하는 것은 쉽지 않을까? 예측을 포함하는 진술을 하고 그 진술의 예측 능력을 검증하는 프로세스가 …

어떤 진술이 과학적인가를 논하는 것보다는 많은 경우에 그렇듯 과학적이지 않은 진술의 조건을 찾는 것이 더 수월할 것이다. 즉 충분조건을 찾기보단 필요조건을 찾는 쪽이 …

Kim Seonghyeon

Machine learning enthusiast

Graduate student in HCCLab at Seoul National University

Korea, Republic of