통계 7

경쟁 위험(Competing Risk)의 이해: 의학 연구에서 왜 중요한가?

의학 연구, 특히 심장학과 같은 임상 분야에서는 사망, 심근경색, 입원 등 다양한 임상 사건의 발생 시점에 관심을 갖습니다. 이러한 연구 설계에서는 환자가 여러 가지 상호 배타적인 사건을 경험할 수 있으며, 그 중 하나가 다른 사건의 발생을 방해하거나 대체하는 경우가 존재합니다. 이처럼 하나의 사건이 다른 사건의 발생 가능성을 제거하거나 변경시키는 상황을 경쟁 위험(Competing Risk)이라고 합니다.본 글에서는 Wolbers et al. (2014)의 논문 "Competing risks analyses: objectives and approaches"를 바탕으로, 경쟁 위험의 개념과 분석 접근법, 그리고 임상 연구에서의 중요성을 정리해 보겠습니다.경쟁 위험이란 무엇인가?경쟁 위험(competing..

통계 2025.03.29

통계학의 강력한 도구: 부트스트랩 방법

부트스트랩의 이해: 적은 데이터로 더 많은 정보 얻기통계학에서 가장 실용적이면서도 우아한 방법 중 하나인 부트스트랩(Bootstrap)은 제한된 데이터에서 최대한의 정보를 추출해내는 기법입니다. '자신의 부츠끈을 잡고 끌어올린다(pull oneself up by one's bootstraps)'는 불가능해 보이는 일을 스스로의 힘으로 해낸다는 의미의 관용구에서 유래한 이 방법은, 미국 통계학자 Bradley Efron이 1979년 논문 "Bootstrap Methods: Another Look at the Jackknife"에서 처음 소개했습니다.부트스트랩이라는 이름은 적은 자원으로 큰 성과를 이루어낸다는 의미를 담고 있습니다. 전통적인 통계 방법으로는 대규모 표본이 필요한 상황에서, 부트스트랩은 단일 ..

통계 2025.03.24

의학 연구의 방법론적 혁신: 코로나19 코르티코스테로이드 치료 연구를 통한 교훈

코로나19 팬데믹은 의학계에 수많은 도전을 안겨주었습니다. 그중에서도 효과적인 치료법을 신속하게 찾아내는 일은 가장 시급한 과제였죠. 하지만 무작위 임상 시험(RCT)을 설계하고 실행하는 데는 시간이 필요했고, 그 사이 관찰 데이터를 기반으로 한 연구들이 쏟아져 나왔습니다.이런 상황에서 한 가지 중요한 질문이 제기됩니다: 관찰 연구는 무작위 임상 시험만큼 신뢰할 수 있는 결과를 제공할 수 있을까요? 2022년에 JAMA Network Open에 발표된 연구는 이 질문에 대한 흥미로운 답을 제시합니다.두 가지 통계 접근법의 대결Hoffman 등의 연구팀은 코로나19 환자에게 코르티코스테로이드 치료가 미치는 효과를 분석했습니다. 이 연구의 특별한 점은 동일한 데이터셋에 두 가지 다른 통계 방법론을 적용했다는..

통계 2025.03.20

Estimand: 임상시험 설계의 핵심 개념

임상 시험에서 새로운 약물이나 치료법의 효과를 평가하는 과정은 복잡합니다. 특히 Graft-versus-Host Disease(GVHD)처럼 복잡한 질환에서는, 효과를 정확히 측정하고 결과를 해석하기 위해 명확한 기준이 필요합니다. 이런 상황에서 등장하는 개념이 바로 Estimand입니다. 이번 글에서는 FDA의 GVHD 가이던스 문서를 참고하여, Estimand가 무엇인지, 그리고 GVHD 연구에서 어떻게 활용되는지 쉽게 풀어 설명해보겠습니다.Estimand란?Estimand는 임상 시험의 설계와 결과 해석에서 연구 질문을 명확히 정의하고, 치료 효과를 측정하는 데 필요한 요소를 구조적으로 설명하는 개념입니다. 단순히 약물의 효과를 확인하는 데 그치지 않고, 시험 과정에서 발생할 수 있는 다양한 변수들..

통계 2025.01.26

[전공서적] Statistical inference (Chapter 1.2 확률 이론의 기본)

확률 이론의 기초 정의와 정리확률 이론은 수학적 엄밀성을 바탕으로 사건의 불확실성을 다룹니다. 이번 포스트에서는 확률 이론에서 가장 기초적이고 중요한 정의와 정리들을 정리해 보았습니다.  확률 이론을 처음 배우는 분들이 반드시 이해해야 할 핵심 개념과 정리들이므로 한번은 보고 넘어가길 추천 드립니다.Definition 1.2.1 (Sample Space)샘플 공간(sample space)은 실험 또는 관찰에서 발생할 수 있는 모든 결과들의 집합을 의미합니다.예를 들어, 동전 던지기 두 번의 샘플 공간은 $S = {HH, HT, TH, TT}$입니다. Definition 1.2.4 (Probability Function)확률 함수는 샘플 공간 $S$와 관련된 시그마 대수 $\mathcal{B}$ 위에서 정..

통계 2025.01.18

[전공서적] Statistical inference (chapter 1.1 확률 이론의 기초)

챕터 1에 대해서는 결론부터 말씀 드리는게 좋을 듯 합니다. 확률 이론의 첫걸음은 샘플 공간과 사건의 정의에서 시작됩니다. 이러한 기초 개념을 명확히 이해하면, 이후의 확률 계산과 통계적 추론이 더욱 간단해집니다. 이 부분은 우리가 약속한 정의를 이렇게 표현할 것이다. 정도로만 인지하고 넘어가셔도 무방할 듯 합니다. 확률 이론의 첫걸음: 집합론(Set Theory)확률 이론은 통계학의 근간을 이루는 학문으로, 데이터를 분석하거나 무작위 현상을 이해하는 데 중요한 역할을 합니다. 이 글에서는 확률 이론의 기초가 되는 집합론(Set Theory)을 살펴보겠습니다. 샘플 공간(Sample Space)이란?샘플 공간은 특정 실험에서 발생할 수 있는 모든 가능한 결과의 집합입니다. 이는 확률 계산의 출발점으로, ..

통계 2025.01.18

[전공서적] statistical inference Casella, Beger (1 시작)

제가 공부했던 통계 내용을 다시 복습하면서 정리해보려고 합니다. 블로그에 이 내용을 기록하는 이유는 두 가지입니다. 하나는 공부한 내용을 다시 정리하면서 머릿속에 확실히 각인시키기 위함이고, 다른 하나는 통계를 배우고자 하는 분들에게 조금이나마 도움이 되고 싶어서입니다.처음으로 살펴볼 전공서적은 바로 Statistical Inference라는 책입니다. 저자는 Casella와 Berger로, 통계학을 공부하는 분들이라면 한 번쯤 들어보셨을 정도로 유명한 책이죠. 이 책은 통계 이론의 기본부터 심화 내용까지 폭넓게 다루고 있어 통계 전공자나 연구자들에게 필독서로 꼽힙니다.블로그에 기록할 때는 최대한 모든 내용을 쉽게 설명하려고 노력할 것입니다. 이 책이 어렵게 느껴지는 분들도 많겠지만, 조금 더 친근하게 ..

통계 2025.01.18