사회학하면 어쩐지 거대한 이론과 담론들로 대표되는 것 같다. 실제로 그게 주요한 사회학의 전통이라고 해도 크게 틀리지는 않을 것이다. 그와는 좀 다른 전통이 있는데 그 …

K값 논란

노령인구 비율과 미분류비율로 그린 산포도인데 상당히 강한 선형입니다. 툭 튀어나와있는 점은 세종시인데 세종시는 아웃라이어라고 볼 수 있겠죠. 그래서 분석에서 일 …

모래더미 모형이라고 마크 뷰캐넌이 자주 써먹는 모형이 있다. 복잡한 모형은 아니다. 평평한 평면 위 어느 한 곳에 모래를 하나 떨어뜨린다고 하자. 똑같은 곳에 모래가 또 …

빅 데이터

잘 아는 것은 아니지만 빅 데이터가 뭔가 생각해보면…빅 데이터라고 할 때 데이터를 분석하는 방법 자체는 다 기존의 통계, 머신 러닝, IR에서 왔다고 할 …

batch normalization의 문제 의식은 뉴럴넷에서 하나의 레이어의 출력은 이전의 레이어의 출력에 의해 영향을 받기에, 깊은 뉴럴넷에서는 이런 &ldquo …

Watts가 Turco & Zuckerman이 쓴 비판에 대한 대응으로 쓴 Response to Turco and Zuckerman’s “Versthen for Sociology"라는 글에서 나온 예시 중에 이런 게 있음. 비틀 …

전통적 통계적 모델링의 대상인 표 형태의 데이터tabular data에 대해서는 딥 러닝이 힘을 못 쓴다(?)는 말을 흔히 한다. 사실 이건 딥 러닝이 이미지나 텍스 …

Breiman이 Statistical Modeling: The Two Cultures에서 보여줬던 것처럼 통계적 모델링에는 대체로 두 가지 경로가 있다. 하나는 데이터의 생성 과정을 기술하여 데이터를 모 …

Kim Seonghyeon

Machine learning enthusiast

Graduate student in HCCLab at Seoul National University

Korea, Republic of