정리 조금 47

Survival Analysis

Intro Survival analysis, 한국어로 생존분석은 관심있는 사건이 발생하는 시간을 통계적으로 분석하는 방법이다. 생존이라 이름이 붙은 이유는, 일반적으로 의료 분야에서 환자의 사망까지 걸리는 시간에 대한 분석을 하기때문으로 생각된다. (뇌피셜임!) 때문에 꼭 사망을 관심있는 사건으로 보지 않아도 된다. 가령, 환자의 예후예측뿐 아니라, 고객의 상품에 대한 이탈 분석에도 사용이 가능하다. 이 포스터에서는 관심있는 사건을 사망으로 보며, 간단히 생존분석의 개념과 비모수 방법중 Kaplan-Meier 추정에 대해 알아볼 예정이다. 이 과목이 디테일하게는 대학원 이상의 수준을 다루고있어서 정보 손실의 최소화라거나, 다른 추정 방식 및 수학적 엄밀함을 포함하는 전반적인 내용은 따로 정리할 예정이다...

Pixel

Pixel 픽셀은 디지털 이미지와 디스플레이를 구성하는 최소단위, Picture element의 약자다. 컴퓨터에서 이미지를 확대해보면, 아주 작은 네모와 그에 할당되어있는 색이 채워져있는걸 확인 할 수 있다. 각 픽셀은 8bit으로 표현 가능한 0 ~ 255 값을 갖는다. 이미지 자료는 보통 이러한 픽셀값의 집합으로 표현된다. 또한 이미지는 2차원의 모양이므로, 그에따라 하나의 2차원 행렬과 같은 모양이 digital image로 사용된다. 별다른 명시가 없다면 각 픽셀은 검정(0)부터 하얀색(255)사이의 값으로 무채색 이미지를 표현한다. Color 만약 색을 지정한 뒤 픽셀값을 준다면, 해당 색의 강도가 픽셀값에 따라 할당된다. 때문에 일반적으로 색을 표현하기 위해 픽셀당 여러 색의 값을 주고 섞으..

IBA1

IBA1 Ionized Caldium-Binding Adapter Molecule 1 (IBA1) 은 이온화된 칼슘에 결합할 수 있는 단백질을 가리킨다. Allograft inflammatory factor 1 (AIF-1) 이라고도 알려져 있으며, human에서는 AIF1 유전자로 encoding 된다. 이 단백질은 원래 쥐의 심장 동종이식 만성 거부 모델에서의 atherosclerotic lesions 에서 발견되었으며, 이 때문인지는 몰라도 이름이 AIF-1이다. 주로 신경 손상, Central Nervous System (CNS) ischemia 및 여러 다른 뇌 질환 후에 microglia에서 up-regulate 된다. 연구의 목적에 따라 microglia를 염색하기위해 사용되기도 한다. Mi..

Multiclass Hinge Loss

Intro Computer vision을 위한 딥러닝 - linear classifier chapter를 듣다가, multiclass hinge loss에 대해 알게되었다. Multiclass support vector machine에 사용되는 loss function이라고 하는데, 처음본다. 오늘은 이 내용에 대해 구현해보자. 하나의 이미지당 하나의 객체를 담고있는 CIFAR data를 사용해 보았다. 아무래도 linear classifier는 하나에 여러개의 복잡한 객체를 담고있는 이미지는 학습이 어렵기 때문에, 그리고 강의에서도 CIFAR-10을 사용했어서 해당 데이터셋을 선택했다. Code Library import numpy as np import pandas as pd import matplo..

Permutation of Regressor Residual

Permutation of Regressor Residual Permutation of Regressor Residual (PRR)은 regression analysis에서 permutation test & covariate adjustment를 같이 할 수 있게하는 방법론이다. Permutation test 종종 적은 표본수의 경우와 같이 모수 기반의 통계기법을 사용하기 어려울 때가 있다. 이럴 때에는 여러 비모수 방법을 사용하는데 그중에서 많이 사용하는 방법으로 permutation test가 있다. 이 방법은 영가설 하에, 주어진 자료의 라벨을 섞음으로 모든 가능한 경우에 대한 영분포를 만든다. (여기서 중요한 부분은 검정 대상이 되는 변수의 관계성이 끊어져야, 원래의 관계성과는 상관없는 영분포가 ..

Weighted Gene Co-expression Network Analysis

예전에 정리해둔 노션을 옮겨왔습니다. 중간중간 옮겨오며 오류가 나는 부분이 있을 수 있습니다. 내용이 너무 많아 한글로 다시 정리하기 힘들어 거의 그냥 가져다놓았습니다 ㅠㅠ Intro WGCNA는 유전자간의 correlation을 기반으로 유전자 군집화를 진행 할 수 있게하는 알고리즘이다. 이 방법은 상당히 직관적인 아이디어로 구성되어있으며, 필요에 따라 biweight midcorrelation과 dynamic tree cut과 같은 독자적인 방법론을 만들어 적용하였다. 개선가능해보이는 부분 또는 풀리지 않은 질문은 이렇게 하이라이트 해놓았다. 총 네 단계로 이루어져 있으며 아래와 같이 작동한다. 이제부터 정리 시작! Weighted Gene Coexpression Network Analysis (WG..

Correlation vs. Causation

상관성과 인과성에 대해 아주 간단하게 정리한 예전 포스트 “Correlation does not imply causation” “Correlation is only a necessary condition for causation” Reversal of causality The greater the number of firefighters dispatched to the scene of a fire, the greater the scale of the fire. Therefore, an increase in the number of firefighters dispatched is a cause of an increase in fires. Although there is a strong correlation..

IC 50

IC 50 Half maximal inhibitory concentration (IC50) 는 in vitro 에서 생물학적인 활성도를 억제(또는 촉진)하는 chemical의 효과를 나타내는 지표이다. 의미 IC50은 생물학 및 약물 연구에서 흔히 사용되는 개념 중 하나로, 어떤 물질이 생물학적 프로세스에 얼마나 강력하게 영향을 미치는지를 측정하는 데 도움이 된다. 만약 어떤 약물이나 화합물을 개발하고 있을 때, 이 약물이 특정 생물학적 프로세스를 얼마나 효과적으로 억제 또는 촉진하는지를 알고 싶을 것이다. 이때, 그 약물의 농도가 중요한 역할을 한다. IC50은 반응이 일어나는 데 필요한 약물의 농도를 나타낸다. 예를들어, 염증이 유발된 세포에 대한 어떤 화합물의 유용성을 조사하고 있을때를 생각해보자...

in vitro, in vivo and in silico

생물학 분야에서 자주 등장하는 라틴어, 이텔릭체로 써야한다. in vitro: within the glass, 시험관에서의 실험. 살아있는 유기체의 밖에서의 실험이다 보니, 실제의 결과와는 차이가 있을 수 있음. in vivo: within the living, 살아있는 유기체 내에서의 실험. 동물 연구 또는 임상 시험의 형태로 이뤄짐. 비용이 많이 듦. in silico: within the silicon, 실리콘 칩 (컴퓨터) 내에서의 실험. 하드웨어의 발달, ngs 기술의 도래 등으로 비교적 최근 대중(?)적으로 가능해진 실험 전략. 정량화 하여 통계분석과 딥러닝 등을 이용한 실험을 포함한다. 이 외에도 종종 나오는 용어는 아래 정도가 있다. in situ : 제자리 에서, 임상에서는 인체의 한 기..

[Python] Paramiko

Paramiko Paramiko는 Python에서 ssh 접속을 제어 가능하도록 하는 라이브러리로, ssh 원격접속과 파일전송을 가능하게하는 Fabric 라이브러리도 paramiko를 기반으로한다. Fabric의 사용 용도보다 심화된 또는 low level의 코딩을 해야하는 때와, Python 내에서 sshd (ssh daemon) 를 돌릴 때에 paramiko를 직접적으로 사용하게된다. 여기서 daemon은 백그라운드 상 요청을 기다리는 프로세스로, sshd는 ssh 연결을 받아주기 위해 대기하는 프로세스정도로 이해하면 된다. 오늘은 파일을 주고 받는정도의 간단한 코드를 소개한다. Code SSH client를 만들고, 연결한다. # Client class ssh = paramiko.SSHClient(..

정리 조금/Codes 2023.10.25