본문 바로가기

반응형
SMALL

분류 전체보기

(15)
생존분석: 경쟁위험(Competing risk) 생존분석을 비롯한 콕스비례위험 분석을 포함한 분석들은 일변량 생존자료 (event/non-event)에만 초점을 두고 있음 But, 다변량 생존자료의 경우도 많이 존재함. (1) 한 환자가 동일한 질환을 여러번 반복해서 경험하는 경우 (재발/ 입원/치료 등) -> reccurent event (재발 또는 반복 사건 자료) (2) 코호트와 같은 관찰연구에서 서로 다른 개체(대상)들이 동일한 이벤트를 동시에 경험하여 관측된 경우 -> clustered (or correlated) data (군집, 또는 상관된 자료) 관찰연구와 같은 종적연구(경시적 자료)에서 한 대상은 서로 다른 유형의 사건(event)를 경험할 수 있음 예) EVENT1 (심혈관 입원) -> EVENT2 (사망) 이러한 경우를 경쟁위험(c..
생일 문제 (Birthday problem) 사람이 생각하는 (인간의 직관)과 다른 결과를 도출하는 경우 (역설적인 상황) 임의의 N명이 모였을 때, 이 중 두명이 생일이 같을 확률은? 이란 상황을 생각해 볼 때 1년은 365일, 윤년(leap year)인 경우 2월 29일 포함하여 366일에 해당한다. 그렇다면 직관적으로 드는 느낌은 거의 없을 것이라고 기대된다. 하지만... 위키백과에 "생일문제"를 검색하면 다음과 같은 그림을 볼 수 있음 위 그림은 인간의 직관과 달리 23명 이상 모이면 이 중 두 명이 생일이 같은 확률이 1/2 (50% 이상)임을 보여준다. N=23 , 두 명이 생일이 같을 확률: 0.51 N=50 , 두 명이 생일이 같을 확률: 0.97 n=100, 두 명이 생일이 같을 확률: 0.9999997로 거의 1에 가까움 N명의 ..
FOAD 가설 성인 질환의 태중 기원설 (Fetal origin of adult disease, FOAD) 영국 역학자 데이비드 바커(David Barker)에 의해 처음 제기되어 '산모의 불충분한 영양, 자궁 내 환경 노출이 태아 시기 조직과 기관을 생성하는 결정적 시기(critical period)에 영향을 미쳐 이 시기의 지속적인 자극이 성장 후 당뇨나 심혈관계 질환 등을 겪을 수 있다는' 바커 가설 (Barker's hypothesis)은 태아 프로그래밍(fetal programming) 또는 성인 질환의 태중 기원설(Fetal origin of adult disease, FOAD) 효시가 되었음 명확한 생물학적 기전은 아직 규명되지 않았으나 산모의 태반을 통한 영양 공급 부족에 대한 적응이, 태아의 조직, 장..
경로분석(Path analysis) 경로분석 이란? 연구자가 관심을 갖고 있는 현상의 원인과 결과로 생각되는 변수들 사이의 관계 즉, 인과 관계에 대해 분석하는 통계적인 방법임 일반적인 통계 모형은 회귀분석을 이용 이론적으로 완벽한 모형을 구축한다면 인과관계를 밝힐 수 있지만, 변수들간의 인과성, 시간적 우선순위를 정하는 것은 굉장히 어려운 일이기 때문에 연구하고자 하는 주제에 대한 배경 지식과 과학적 근거가 요구됨 경로분석은 각 변수의 전후 관계를 계산할 수 있음 경로분석에는 공분산 행렬 또는 상관행렬이 이용됨 공분산 행렬은 편차의 제곱의 합 상관 행렬은 공분산 행렬을 해당 변수의 표준편차로 나눈 값 (즉, 표준화) 경로분석의 기본가정 1. 변수들 간의 연결은 선형적(linear), 부가적(additive) 2. 하나의 측정 변수가 잠재..
분포의 중심 위치 분포의 중심위치는 자료의 대표값을 나타내며, 이러한 자료의 중심을 측정하는데 사용되는 수단은 다음과 같음 최빈값(mode): 가장 빈번하게 나타나는 값 중앙값(median): 자료를 크기순으로 나열(정렬) 했을때 가운데 오는 값을 의미 중간값(midpoint): (최대값-최소값)/2 위치에 해당 평균(mean): 모든 관측 자료를 더한 후 전체 관측개수(n)로 나눈 값을 의미 이러한 값들은 여러 자료들을 하나의 값으로 대표하는 자료이기 때문에 정보의 손실이 발생할 수 있으며, 따라서 실제 자료와 대표값의 수치 차이를 손실함수(loss function or cost function)으로 표현할 수 있음 최빈값에 대한 loss function $$ L(g)=\sum_{i}^{n} {y}_{i} \qquad ..
생존분석 생존율을 산출하고 생존시간을 추정하는 통계적 방법으로 절단(censoring)을 고려하여 time-to-event에 대한 분석을 하기위해 모수적, 준-모수적 (콕스비례모형), 비모수적 방법(생명표, 카플란-마이어 추정) 방법등을 이용함 절단이란? 크게 두가지로 좌절단(left censoring)과 우절단(right censoring)으로 구분될 수 있음 좌절단(left censoring) 관찰기관보다 event 발생 시각이 빠른 경우를의미 우절단(right censoring) 관찰기간보다 event 발생 시각이 느린 경우 $$ h(t) =\frac{f(t)}{1-F(t)} $$ $$ F(t)=P(T
[WINDOW 10] 시스템 오류시 자동 재부팅 방지 시스템 오류시 WINDOW 10이 자동으로 재부팅 되는 경우가 있음. 재부팅을 원하지 않는다면 다음 방법으로 옵션을 설정하자. 1. 내 PC의 설정에서 [속성]을 클릭 2. 고급 시스템 설정을 클릭 3. 시스템 속성 [고급] 탭에서 시작 및 복구 우측 아래 설정 클릭 4. 시작 및 복구에서 [시스템 오류] 아래 "자동으로 다시 시작(R)"의 체크 박스를 해제
[WINDOW 10] 자동업데이트 방지 PC를 자주 켜놓는 경우가 많은데 요새들어 자동 재부팅 되는 경우가 많아졌다. 윈도우 10에서 자동 업데이트를 하면 자동 재부팅이되기 때문에 이를 방지하는 방법에 대해 적어보자. 1. 검색창 - "gpedit.msc" 입력 2. 아래 그림의 왼쪽 폴더트리에서 다음과 같이 이동 "컴퓨터 구성 -> 관리 템플릿 -> Window 구성 요소 -> Window 업데이트" 3. 우측의 설정 내용 중 "자동 업데이트를 통한 권장 업데이트 설정" 에서 상태를 "구성되지 않음" -> "사용" 으로 변경 4. 재부팅
대기오염과 건강영향연구 환경 역학연구에서 주로 대기오염과 건강영향을 다룰때, 다루는 대표적인 연구 디자인 (1) Ecological time-series (2) Case-crossover design (3) Panel design (4) Cohort study Time-series, Case-crossover, Panel study는 대기오염의 급성건강영향을 평가하는데 유용 *급성영향(acute effect)는 시간 가변(time-varying exposure)로 인해 전이가 일어나는것이며, 주로 다루는 건강 영향은 사망, 질병 발생, 변이(vital capaticty, lung growth, symptom sverity, and etc.) Panel study는 개인을 반복측정하면서 시간을 고려할 수 있으며, 반복측정된 자료..
[SAS] 라이브러리 내 테이블 행, 열 수 찾기 SAS 라이브러리내 DB가 많을 경우 원 자료의 행과열의 n수가 궁금할 때가 있음. 그러한 경우 아래와 같은 코드로 탐색할 수 있음 /*SAS 라이브러리 */ libname A 'D:\' ; /*현재 라이브러리 내에서 테이블명, 행, 열 수 찾기 */ proc sql;CREATE TABLE table_str AS select MemName as table_name, nobs as nrow ,NVar as ncol from sashelp.vtable where Libname = 'A'; /*라이브러리 지정*/ quit;

반응형
LIST