Showing items from 软件使用

R包caret基本功能【1】——六种基本功能

介绍机器学习R包。 1. 数据分割 基于输出变量的分割 在建模之前,需要对样本数据进行分割分为训练集和测试集。在之前建模过程中,我发现我使用sample进行分割存在一定的问题,比如我分割出来的数据中response的占比在训练集和测试集中差别很大等等。caret包中可以解决这个问题,通过设置p值,同 …

Continue Reading

检测拷贝数变异的工具及算法【2】-ABSOLUTE

背景介绍 1. 获取绝对拷贝数数值的难点 (1)采样过程中癌细胞混合了未知比例的正常细胞——肿瘤纯度; (2)由于染色体数量和结构异常导致的癌细胞的实际DNA含量(倍性)是未知的; (3)由于正在进行的亚克隆进化,癌细胞群可能是异质性的。 理论上,如果知道每个肿瘤细胞中DNA的含量,则可通过测得的相 …

Continue Reading

synapser

引言 一个提供批量下载Synapser数据的R包。 1. 登陆 synLogin("baomihai@sina.com","******") Welcome, baomihai@sina.com!NULL 参考 biostars-How to install …

Continue Reading

gdc-client

引言 之前一直用别的方法下载数据,这次使用了gdc-client命令行去下载GDC上TCGA driver gene mutation的一批数据。 步骤 1. 找到自己需要的数据 这是我本次要下载的数据 点击数据下载地址发现出现如下界面,其中id就是使用gdc-client下载的文件对应的id 对 …

Continue Reading

使用CIBERSORTx网页版分析免疫浸润

前言

最近需要对TCGA和PCAWG的表达数据进行免疫浸润水平分析,使用了R包immunedeconv,其中TCGA已经有文献的supplement给出了不同免疫浸润工具进行分析的结果,PCAWG需要自己手动分析,其中CIBERSORT在immunedeconv包中运行需要两个文件:LM22.txt …

Continue Reading