2018년 4월 16일 월요일

다층모형의 특징과 공부 방법

다층모형의 특징과 공부 방법
 
앞에서 첫째, 독립표본 t검정, 상관분석, 분산분석, 회귀분석, 로지스틱 회귀분석과의 관계에서 다층모형과 둘째, 대응표본 t 검정, 반복측정 분산분석, 다변량분산분석, 회귀분석, 일반선형모형, 잠재성장모형과의 관계에서도 다층모형을 소개해 보았습니다. 오늘은 양적 연구방법으로서 다층모형의 특징과 공부 방법을 간략히 정리해 보겠습니다.

 
다층모형을 한마디로 하면 개인변수와 조직변수를 구분해서 하는 회귀분석이라고 할 수 있습니다.
 
그동안 회귀분석이나 경로모형, 요인분석, 구조방정식에서는 단일차원 즉, 개인차원이나 조직차원 둘 중에 하나의 차원에서 변수들 간의 관계를 고찰하였습니다.
하지만 회귀분석은 다층선형모형, 다층경로모형, 다층요인분석, 다층구조방정식으로 우리가 변수들의 관계를 살필 때, 개인변수와 조직변수를 구분해서 살피는 것이 필요합니다.
 
개인변수와 조직변수를 구분해서 모형화해야 하는 이유가 무엇일까요? 일반적인 회귀분석에서 우리는 정규성, 등분산성, 선형성, 그리고 독립성 가정을 기반으로 합니다. 그런데 회귀식에서 개인변수를 종속변수로 하고 그 개인변수의 결과치 즉 종속변수(: 수능성적, 환자여부, 만족도, 생산성 등)를 설명하는 독립변수 중에 개인특성 변수를 개별적으로 고려하지만, 같은 학교에 다니는 학생은 모두 같은 학교유형(공립, 사립여부) 등 모두 같은 변수가 동시에 들어가게 됩니다. 여기서 일종의 독립성 가정이 위반된다고 볼 수 있습니다.
 
또한 앞에서도 말씀드렸던 것처럼, 변수들 간의 관계가 개인 간의 관계와 조직 간의 관계가 다를 수도 있습니다. 최근의 미국 대통령 선거에서 개인 투표자의 득표율은 힐러리 후보가 높았지만, 연방정부의 특성상 주단위로 의사결정을 했을 때는 트럼프 후보가 더 높았습니다. 이 대통령 선거의 예는 다층모형의 논리랑 조금은 다를 수도 있지만, 제가 여기서 이 예를 드는 것은 우리가 선택한 분석단위나 의사결정의 수준이 의사결정의 방향이나 크기에 영향을 줄 수 있다는 점을 강조하기 위함입니다.
 
다층모형의 가장 큰 특징은 변수들 간의 관계를 나타내는 기울기나 절편의 크기에 관심을 갖는 고정효과모형에 더하여 각 수준별, 즉 개인수준과 집단수준의 변 자체에 관심을 더 많이 갖는다는데 있습니다.
 
다층모형의 선수과목은 기초통계, 분산분석, 회귀분석 등이라고 할 수 있는데, 이러한 방법론에서는 개별모수(평균, 상관, 회귀계수 등)에 대한 가설검정을 주로 했습니다. 하지만, 다층모형에서는 개별모수의 크기에 대한 평가와 함께, 개인수준과 집단수준의 변량의 존재여부 및 변량의 구성 비율 등에 대한 추정을 강조합니다. 그리고 일반적인 회귀분석처럼 이론적 근거나 이론모형이 중요한 점은 같습니다. 연구자의 연구문제에 대한 통찰력과 선행연구에 대한 철저한 분석이 필요한 이유입니다.
 
다층모형에서 고정효과와 랜덤효과에 대한 검정을 하는데 있어서 영가설을 이해하는 것이 필요합니다. 고정효과 모형에서는 기울기나 절편이 0 인지 여부를 검정합니다. 랜덤효과 모형에서는 각 수준별 변량이 0 인지 여부를 검정합니다. 랜덤효과 모형에 대한 이해를 잘 하는 것이 다층모형에서는 매우 중요합니다.
 
여기서 우리가 공부해야 할 것은 다음과 같습니다.
 
첫째, 분산분석의 기본원리에 대한 이해
 
둘째, 분산분석에서 랜덤 요인 (Random factor vs. fixed factor 비교)
 
셋째, 반복측정에서 개체효과가 랜덤요인이라는 점 이해
 
다층모형은 기본적으로 변수들 간의 관계이므로, 산포도, 상관분석, 회귀분석, 로지스틱 회귀분석등과 분산분석, 공분산 분석등이 결합된 일반선형 모형에 대한 학습 및 이해가 필요합니다.
 
일반적으로 다층모형은 크게 조직효과성 연구와 성장모형으로 나눌 수 있습니다. 그밖에 메타분석, 3수준모형, HGLM 모형 등으로 구분됩니다.
 
다층모형이 사회복지, 행정학, 교육학 등 사회과학분야의 석박사 논문에서 아주 많이 사용되고, 구조방정식과 함께 기관에서 수집한 패널데이터 분석에서 주로 사용되고 있습니다. 요즘에는 의료분야에서도 건강보험 데이터가 공개되는 등으로 인해 의료분야에서도 점차 적용빈도가 증가하고 있습니다.
 
다만, 다층모형에 대한 기본적인 이해가 부족한 상태에서 석박사논문이나 학술지를 작성하는 경우가 많습니다. 기본서를 한권 정해서 충분히 읽고 그 다음에는 관련 전공 분야의 좋은 저널에 실린 최근 다층모형 논문을 최소한 10개 이상 여러 번 읽으면서 다층모형의 기본개념, 절차, 적용논리를 학습하시기 바랍니다.
 
보통 Raudenbush의 교재를 저는 기본서로 사용하는데요, 최근에 한국어로는 강상진 교수님의 교재가 새롭게 나와서 영어를 어려워하는 우리들에게는 한글 기본서가 생긴 것은 다행이라고 생각합니다. 많이 쓰는 프로그램은 우리나라에서는 HLM7 프로그램을 주로 사용하다가 최근에는 STATA, Mplus, R등도 많이 사용하고 있습니다.

양적연구방법에는 위계가 있다는 점을 항상 기억하시고 차례대로 공부하고 이해하려고 노력하는 게 필요합니다.

 
다층모형과 관련된 최근 연구방법은 다층모형과 다층모형이 결합된 다층구조모형이고, 제가 전공한 메타분석과 다층모형이 결합된 다층메타분석모형에 대한 논의가 활발하게 이루어지고 있습니다. 고급연구방법에 관심 있는 분들은 이러한 분야에 도전해 보시는 것도 의미 있는 일이라고 생각됩니다.
 
제가 전공한 메타분석은 사실 기본적으로 다층모형입니다. 제 박사논문 종합시험 문제는 다층모형과 메타분석의 관계를 논하라는 문제 이었습니다. 또한 진단검사 정확도 메타분석, 메타구조방정식 등에서도 기본적으로 데이터 구조를 다층으로 보고 다층모형적 접근을 시도하고 있습니다. 메타분석의 랜덤효과 모형의 기본개념도 다층모형의 기본원리에 대한 이해를 필요로 합니다.
 
최근 고급기법은 기본적으로 다변량, 다층모형 같습니다. 오늘은 기본적인 개념과 대강의 절차를 소개해 보았습니다. 시간나는대로 각 고급주제별로, 세부 개념과 절차별 논점을 차례로 정리해 보겠습니다.

댓글 없음:

댓글 쓰기

(온라인 강의 병행) 2022년 12월~ 2023년 2월 교육통계연구소 전체 특강 일정 및 연구모임 일정 (온라인 강의 FAQ 포함)

 *** 교육통계연구소 전체 특강 일정 및 신청 링크 https://blog.naver.com/9065031/221690496362 논문을 쓰고 지도하는 일은 매우 외롭고 힘든 과정입니다. 교육통계연구소에서는 매달 2주, 4주 화요일 저녁...