L1000 7

[re-15] L1000CDS2: LINCS L1000 characteristic direction signatures search engine

[15] 번째로 읽은 논문의 초록을 다시 보고 정리함. https://jaehong-data.tistory.com/38 [15] L1000CDS2: LINCS L1000 characteristic direction signatures search engine 2016 The library of integrated network-based cellular signatures (LINCS) L1000 데이터 세트는 현재 백만 개 이상의 chemically activated human cell line 유전자 발현 프로필로 구성되어 있다. 고유한 여러 내제 및 외재적인 jaehong-data.tistory.com 초록 LINCS L1000 data set: Chemically perturbated human ..

[21] EMUDRA: Ensemble of Multiple Drug Repositioning Approaches to improve prediction accuracy

2018 Motivation 복잡한 질병에서 대규모 genomic, epigenetic and proteomic 데이터의 이용으로 새로운 치료 대상을 객관적으로 찾을 수 있음. Connectivity Map은 기존 약물의 새로운 표적을 찾는 데 널리 사용되나, 기존 방법의 정확도가 낮음. Result Expression weighted cosine (EWCos) 방법 도입으로 비정보성 발현 변화의 영향 최소화. EWCos와 기존 최신 방법을 통합하는 'Ensemble of Multiple Drug Repositioning Approaches' (EMUDRA) 개발. EMUDRA는 시뮬레이션 및 독립 평가 데이터셋에서 개별 약물 재조합 방법보다 우수한 성능을 보임. EMUDRA를 사용하여 항생제 rifab..

[16] Evaluation of connectivity map shows limited reproducibility in drug repositioning

2021 Connectivity Map (CMap)은 대규모의 전사체 자료를 사용하여 데이터 기반의 drug repurposing에 활용되는 data resource이다. 하지만, 이는 제한적인 성능평가를 갖는다. 우리는 CMap의 두가지 버젼인 CMap1과 CMap2의 비교 및 신뢰성을 평가하기 위해 두 차례의 시도를 하였다. CMap1에서 유래된 signature를 사용하여 CMap2에 쿼리를 주어 그 화합물을 높은 우선순위로 처리할 것을 기대했지만, 성공률은 17%에 불과했다. 이전에 발표된 우선순위 지정 분석은 유사한 결과를 보였다. 낮은 recall은 각각의 CMap에서의 낮은 differential expression (DE) 재현성을 보이기 때문이다. DE 강도는 재현성을 예측하는 데 영향을..

[15] L1000CDS2: LINCS L1000 characteristic direction signatures search engine

2016 The library of integrated network-based cellular signatures (LINCS) L1000 데이터 세트는 현재 백만 개 이상의 chemically activated human cell line 유전자 발현 프로필로 구성되어 있다. 고유한 여러 내제 및 외재적인 벤치마킹 체계를 통해 L1000 데이터를 Characteristic Direction (CD) 방법으로 처리하면 현재 L1000 signature를 계산하는데, 사용되는 MODZ 방법과 비교하여 신호 대 잡음이 크게 향상한다는 것을 보여준다. CD로 처리된 L1000 signature는 L1000CDS2 라는 첨단 웹 기반 검색엔진 응용 프로그램을 통해 제공된다. L1000CDS2는 두가지 방법을 ..

[14] Deep Learning Benchmarks on L1000 Gene Expression Data

2019 유전자 발현 데이터는 유전체의 static coding이상의 깊은 생리학적 통찰력을 제공할 수 있다. 이 잠재성을 실현하기 위해 생물학적인 구조를 활용할 수 있는 특화된 고용량 기계학습 방법이 필요하다. 그러나 이러한 모델의 개발은 출판된 벤치마크 작업과 잘 정의된 baseline의 부족으로 인해 어려움을 겪고 있다. 본 연구에서는 크게 구성된 두가지 정제된 관점 (LINCS corpus) 및 개인 제작 데이터셋에 대한 생물학적 동기부여 작업에 대한 많은 분류기의 프로파일링을 통해 이러한 벤치마크와 baseline을 수립한다. 우리는 이 두가지 정제된 LINCS 데이터셋과 벤치마크 작업을 제공하여 향후 방법론적인 연구와 이 모드에서의 딥러닝 방법 개발을 직접 비교하고 촉진하는데 도움을 준다. 전..

[12] A Bayesian approach to accurate and robust signature detection on LINCS L1000 data

2020 Motivation LINCS L1000 데이터는 다양한 변형요인 집합에 의해 유발된 세포발현 데이터를 포함하고 있습니다. 이 데이터는 약물 개발 및 질병의 메커니즘 이해를 위한 귀중한 자원을 제공하지만, 기존의 피크 분해하는 알고리즘은 많은 경우에 유전자의 정확한 발현 수준을 복구할 수 없어 데이터셋에 심각한 노이즈를 유발하며, 생명과학 연구에서의 응용 가능성을 제한합니다. Result 여기서 우리는 peak deconvolution을 위한 베이지안 방법론을 제안하며, 이 방법은 피크의 위치에 대한 unbiased lokelihood estimation을 제공하며, 확률 기반의 z-score를 통해 peak을 활성화 시킨다. 위 알고리즘을 기반으로 우리는 L1000 실험에서의 원시 데이터를 변..

[4] LINCS L1000 dataset-based repositioning of CGP-60474 as a highly potent anti-endotoxemic agent

2018 패혈증은 사망과 장애를 유발하는 가장 흔한 증후군 중 하나이다. 치료를 위해 다양한 약물이 개발되어 왔지만, 아무런 연구도 사망률을 감소시키지 못했다. 이 연구의 목표는 in vitro와 in vivo에서 패혈증 모델에 기반한 LINCS L1000 perturbation (이하 L1000) 자료를 통해 패혈증에 대한 시료운 치료 옵션을 찾는 것이다. 이 병과 연관된 초기의 염증과정에 대한 마이크로어레이 연구결과를 환자와 면역세포에서 얻어와 L1000을 기반으로 후보 약물을 선택하는 데 사용 되었다. 선택된 후보 약물의 항염작용 효과는 활성화된 macrophage 세포주를 사용하여 분석되었다. Cyclin-dependent kinase의 inhibitor인 CGP-60474가 가장 강력한 약물이었..