정리 조금/Bioinformatics & Biostatistics 6

Survival Analysis

Intro Survival analysis, 한국어로 생존분석은 관심있는 사건이 발생하는 시간을 통계적으로 분석하는 방법이다. 생존이라 이름이 붙은 이유는, 일반적으로 의료 분야에서 환자의 사망까지 걸리는 시간에 대한 분석을 하기때문으로 생각된다. (뇌피셜임!) 때문에 꼭 사망을 관심있는 사건으로 보지 않아도 된다. 가령, 환자의 예후예측뿐 아니라, 고객의 상품에 대한 이탈 분석에도 사용이 가능하다. 이 포스터에서는 관심있는 사건을 사망으로 보며, 간단히 생존분석의 개념과 비모수 방법중 Kaplan-Meier 추정에 대해 알아볼 예정이다. 이 과목이 디테일하게는 대학원 이상의 수준을 다루고있어서 정보 손실의 최소화라거나, 다른 추정 방식 및 수학적 엄밀함을 포함하는 전반적인 내용은 따로 정리할 예정이다...

Weighted Gene Co-expression Network Analysis

예전에 정리해둔 노션을 옮겨왔습니다. 중간중간 옮겨오며 오류가 나는 부분이 있을 수 있습니다. 내용이 너무 많아 한글로 다시 정리하기 힘들어 거의 그냥 가져다놓았습니다 ㅠㅠ Intro WGCNA는 유전자간의 correlation을 기반으로 유전자 군집화를 진행 할 수 있게하는 알고리즘이다. 이 방법은 상당히 직관적인 아이디어로 구성되어있으며, 필요에 따라 biweight midcorrelation과 dynamic tree cut과 같은 독자적인 방법론을 만들어 적용하였다. 개선가능해보이는 부분 또는 풀리지 않은 질문은 이렇게 하이라이트 해놓았다. 총 네 단계로 이루어져 있으며 아래와 같이 작동한다. 이제부터 정리 시작! Weighted Gene Coexpression Network Analysis (WG..

The Characteristic Direction

정리The Characteristic Direction The characteristic direction (chdir)은 Differential Expressed Gene (DEG)방법 중 하나이다. 이 방법은 Linear Discriminant Analysis (LDA)를 활용했다. LDA는 supervised learning 방법으로 두 그룹간의 차이를 가장 잘 반영하는 초평면을 구하는 방식이다. 차원의 축소, 결정경계 추청 등 여러 방면에 활용 가능한 알고리즘이다. 포스트 참고 https://jaehong-data.tistory.com/15 Linear Discriminant Analysis예전에 notion으로 정리해둔 개념(본문 가장 아래 영어로 정리된 부분)을 옮기고 한글로 요약한 포스터입..

ZIBseq

Intro Microbiome data 분석 역시 그룹간 유의미하게 다른 microbiome을 찾는것이 정말 중요하다. 참고로 Differentially Expressed Genes (DEG) 를 찾는 과정과 매우 유사하며, microbiome자료 에서는 유의미하게 다른 microbiome을 주로 Differential Abundance Features (DAFs) 라고 부른다. Microbiome data는 ASV나 OTU를 사용하는데, 결국 tabluar count data이기 때문에 기존의 RNAseq 분석 방법과 크게 다르지 않다 생각할 수 있다. 때문에 이전 포스터에서 소개한 edgeR과 DESeq2도 DAFs를 찾는데 사용이 가능하지만, microbiome의 생물학적 특성에 맞는 다른 여러 방..

edgeR & DESeq2

Intro edgeR과 DESeq2는 RNAseq downstream analysis를 하다 보면 한번쯤은 보게되는 논문이다. 두 가지 모두 biomarker selection에 대한 방법론과 해석을 제시한다. 먼저 edgeR(2010)이 나오고 DESeq2(2014)가 나왔으며 두 논문 citation수가 (2022/10/12기준) 각각 27575회, 42124회 이다. 엄청난 파워가 있는 논문들로 아직까지 커뮤니티에 질문과 답변이 활발하게 올라오고 있다. 이 논문들은 biomarker selection을 위한 Differentially Expressed Gene(DEG) 분석 논문이다. DEG: control(normal healthy group)과 case(patient group)간의 차이나는 f..