什么,你需要1T内存

发布时间:2021-8-17 12:04:08 点击数：次

白癜风吃药能好吗 http://m.39.net/pf/a_6712021.html

最近接了一个61个10x的单细胞转录组样品项目，使用以前的流程，自动进行质量控制，降维聚类分群，本来应该是分分钟的事情，但是在一个步骤居然卡死了，我看了的这个函数，doubletFinder_v3，是去除单细胞转录组里面的双细胞作用，报错如下所示：

sce.all.filt-doubletFinder_v3(sce.all.filt,pN=0.25,pK=0.09,nExp=nExp,PCs=1:10)Loadingrequiredpackage:fieldsLoadingrequiredpackage:spamLoadingrequiredpackage:dotCall64Loadingrequiredpackage:gridSpamversion2.6-0(-12-14)isloaded.KernSmooth2.23loadedCopyrightM.P.Wand-[1]"Creatingartificialdoublets..."[1]"CreatingSeuratobject..."[1]"NormalizingSeuratobject..."Performinglog-normalization0%%[----

----

**************************************************

[1]"Findingvariablegenes..."Calculatinggenevariances0%%[----

----

**************************************************

Calculatingfeaturevariancesofstandardizedandclippedvalues0%%[----

----

**************************************************

[1]"Scalingdata..."Centeringandscalingdatamatrix

=========================================================

%[1]"RunningPCA..."[1]"CalculatingPCdistancematrix..."Error:cannotallocatevectorofsize.4Gb

原来是因为我把61个10X单细胞转录组样品项目的全部单细胞数据合并后，细胞数量太多了，一次性走doubletFinder_v3函数，超出了它的限制。

也就是说，先合并样品，再走doubletFinder_v3，连我的服务器也无法hold住，所以我先把61个10X单细胞转录组样品拆分开来，然后每个10x样品自己独立走doubletFinder_v3函数，代码如下：

#拆分为个seurat子对象sce.all.list-SplitObject(sce.all,split.by="orig.ident")sce.all.listlibrary(DoubletFinder)#sce.all.filt=sce.all.list[[1]]phe_lt-lapply(names(sce.all.list),function(x){sce.all.filt=sce.all.list[[x]]sce.all.filt=FindVariableFeatures(sce.all.filt)sce.all.filt=ScaleData(sce.all.filt,vars.to.regress=c("nFeature_RNA","percent_mito"))sce.all.filt=RunPCA(sce.all.filt,npcs=20)sce.all.filt=RunTSNE(sce.all.filt,npcs=20)sce.all.filt=RunUMAP(sce.all.filt,dims=1:10)nExp-round(ncol(sce.all.filt)*0.04)#expect4%doubletssce.all.filt-doubletFinder_v3(sce.all.filt,pN=0.25,pK=0.09,nExp=nExp,PCs=1:10)#nameoftheDFpredictioncanchange,soextractthecorrectcolumnname.DF.name=colnames(sce.all.filt

meta.data)[grepl("DF.classification",colnames(sce.all.filt

meta.data))]p5.dimplot=cowplot::plot_grid(ncol=2,DimPlot(sce.all.filt,group.by="orig.ident")+NoAxes(),DimPlot(sce.all.filt,group.by=DF.name)+NoAxes())p5.dimplotggsave(filename=paste0("doublet_dimplot_",x,".png"),plot=p5.dimplot)p5.vlnplot=VlnPlot(sce.all.filt,features="nFeature_RNA",group.by=DF.name,pt.size=0.1)p5.vlnplotggsave(paste0("doublet_vlnplot_",x,".png"),plot=p5.vlnplot)print(table(sce.all.filt

meta.data[,DF.name]))#过滤doubletphe=sce.all.filt

meta.dataphe})

虽然是运行了一天一夜才完成。有了结果，就可以去除双细胞啦，代码如下：

kpCells=unlist(lapply(phe_lt,function(x){#table(x[,ncol(x)])rownames(x[x[,ncol(x)]==Singlet,])}))kp=colnames(sce.all)%in%kpCellstable(kp)sce=sce.all[,kp]

这样我还是拿到了最终的sce对象，后续分析就没有什么问题了！如下所示的一个简单的降维聚类分群图：

当然了，如果你对单细胞数据分析还没有基础认知，可以看基础10讲：

01.上游分析流程02.课题多少个样品，测序数据量如何03.过滤不合格细胞和基因（数据质控很重要）04.过滤线粒体核糖体基因05.去除细胞效应和基因效应06.单细胞转录组数据的降维聚类分群07.单细胞转录组数据处理之细胞亚群注释08.把拿到的亚群进行更细致的分群09.单细胞转录组数据处理之细胞亚群比例比较

另外，我们对这样的内存问题还提供两个解决方案：

可以租用共享服务器：手快有，手慢无（共享96线程G内存服务器），仅需要元即可可以直接委托我们来进行数据处理：明码标价之10X转录组原始测序数据的cellranger流程，仅需要元即可生信技能树

不点赞也不打赏，为什么呢？

转载请注明：http://www.zmax-alibaba.com/qgwf/137979.html

上一篇文章：测试用例管理平台代码实现1让我们把开发环

下一篇文章：没有了

您现在的位置：情感测试简介_情感测试玩法 > 情感测试玩法 > 什么,你需要1T内存

什么,你需要1T内存

最新文章

热点文章

推荐文章

您现在的位置： 情感测试简介_情感测试玩法 > 情感测试玩法 > 什么,你需要1T内存

什么,你需要1T内存

最新文章

热点文章

推荐文章

您现在的位置：情感测试简介_情感测试玩法 > 情感测试玩法 > 什么,你需要1T内存