BrainImageR提供了一套工具，可以将基因表达数据与艾伦大脑图谱中的死后人脑数据进行比较。BrainImageR有两个主要功能，第一个在第一节是利用发育中的大脑或成年大脑作为参考材料来表征人脑中的空间基因集富集(SGSE)。第二，在第二节，预测样本所对应的发育时间的大致点。

比较你的数据集和人类死亡后的参考:

量化SGSE
定性地绘制SGSE地图
预测发育时间

图书馆(brainImageR)已注册S3方法被'ggplot2'覆盖:#>方法# >(。quosures rlang#> c. quosurerlang# >打印。quosures rlang已注册S3方法被'dplyr'覆盖:#>方法#> as.data.frame.tbl_df tibble图书馆(ggplot2)brainImageR：：:loadworkspace（）#> snapshotDate(): 2018-10-31Bioconductor版本3.9 (BiocManager 1.30.3)， R正在开发中#>(不稳定)(2018-10-16 r75448)#>安装包“brainimageRdata”#>更新旧包:'reactome.db'#>下载0个资源#>从缓存加载# > / home / biocbuild / /。ExperimentHub / 1434”Bioconductor版本3.9 (BiocManager 1.30.3)， R正在开发中#>(不稳定)(2018-10-16 r75448)#>安装包“brainimageRdata”#>更新旧包:'reactome.db'#>下载0个资源#>从缓存加载# > / home / biocbuild / /。ExperimentHub / 1435”Bioconductor版本3.9 (BiocManager 1.30.3)， R正在开发中#>(不稳定)(2018-10-16 r75448)#>安装包“brainimageRdata”#>更新旧包:'reactome.db'#>下载0个资源#>从缓存加载# > / home / biocbuild / /。ExperimentHub / 1436”Bioconductor版本3.9 (BiocManager 1.30.3)， R正在开发中#>(不稳定)(2018-10-16 r75448)#>安装包“brainimageRdata”#>更新旧包:'reactome.db'#>下载0个资源#>从缓存加载# > / home / biocbuild / /。ExperimentHub / 1437”Bioconductor版本3.9 (BiocManager 1.30.3)， R正在开发中#>(不稳定)(2018-10-16 r75448)#>安装包“brainimageRdata”#>更新旧包:'reactome.db'#>下载0个资源#>从缓存加载# > / home / biocbuild / /。ExperimentHub / 1438”Bioconductor版本3.9 (BiocManager 1.30.3)， R正在开发中#>(不稳定)(2018-10-16 r75448)#>安装包“brainimageRdata”#>更新旧包:'reactome.db'#>下载0个资源#>从缓存加载# > / home / biocbuild / /。ExperimentHub / 1439”Bioconductor版本3.9 (BiocManager 1.30.3)， R正在开发中#>(不稳定)(2018-10-16 r75448)#>安装包“brainimageRdata”#>更新旧包:'reactome.db'#>下载0个资源#>从缓存加载# > / home / biocbuild / /。ExperimentHub / 1440”Bioconductor版本3.9 (BiocManager 1.30.3)， R正在开发中#>(不稳定)(2018-10-16 r75448)#>安装包“brainimageRdata”#>更新旧包:'reactome.db'#>下载0个资源#>从缓存加载# > / home / biocbuild / /。ExperimentHub / 1441”Bioconductor版本3.9 (BiocManager 1.30.3)， R正在开发中#>(不稳定)(2018-10-16 r75448)#>安装包“brainimageRdata”#>更新旧包:'reactome.db'#>下载0个资源#>从缓存加载# > / home / biocbuild / /。ExperimentHub / 1442”Bioconductor版本3.9 (BiocManager 1.30.3)， R正在开发中#>(不稳定)(2018-10-16 r75448)#>安装包“brainimageRdata”#>更新旧包:'reactome.db'#>下载0个资源#>从缓存加载# > / home / biocbuild / /。ExperimentHub / 1443”Bioconductor版本3.9 (BiocManager 1.30.3)， R正在开发中#>(不稳定)(2018-10-16 r75448)#>安装包“brainimageRdata”#>更新旧包:'reactome.db'#>下载0个资源#>从缓存加载# > / home / biocbuild / /。ExperimentHub / 1444”Bioconductor版本3.9 (BiocManager 1.30.3)， R正在开发中#>(不稳定)(2018-10-16 r75448)#>安装包“brainimageRdata”#>更新旧包:'reactome.db'#>下载0个资源#>从缓存加载# > / home / biocbuild / /。ExperimentHub / 1445”Bioconductor版本3.9 (BiocManager 1.30.3)， R正在开发中#>(不稳定)(2018-10-16 r75448)#>安装包“brainimageRdata”#>更新旧包:'reactome.db'#>下载0个资源#>从缓存加载# > / home / biocbuild / /。ExperimentHub / 1446”Bioconductor版本3.9 (BiocManager 1.30.3)， R正在开发中#>(不稳定)(2018-10-16 r75448)#>安装包“brainimageRdata”#>更新旧包:'reactome.db'#>下载0个资源#>从缓存加载# > / home / biocbuild / /。ExperimentHub / 1447”Bioconductor版本3.9 (BiocManager 1.30.3)， R正在开发中#>(不稳定)(2018-10-16 r75448)#>安装包“brainimageRdata”#>更新旧包:'reactome.db'#>下载0个资源#>从缓存加载# > / home / biocbuild / /。ExperimentHub / 1448”Bioconductor版本3.9 (BiocManager 1.30.3)， R正在开发中#>(不稳定)(2018-10-16 r75448)#>安装包“brainimageRdata”#>更新旧包:'reactome.db'#>下载0个资源#>从缓存加载# > / home / biocbuild / /。ExperimentHub / 1449”Bioconductor版本3.9 (BiocManager 1.30.3)， R正在开发中#>(不稳定)(2018-10-16 r75448)#>安装包“brainimageRdata”#>更新旧包:'reactome.db'#>下载0个资源#>从缓存加载# > / home / biocbuild / /。ExperimentHub / 1450”Bioconductor版本3.9 (BiocManager 1.30.3)， R正在开发中#>(不稳定)(2018-10-16 r75448)#>安装包“brainimageRdata”#>更新旧包:'reactome.db'#>下载0个资源#>从缓存加载# > / home / biocbuild / /。ExperimentHub / 1451”

第一节:空间基因集富集分析

空间基因集富集(SGSE)工具为用户提供了死后大脑中基因集富集的定量测量，以及深入挖掘跨区域重叠的基因的附加工具，以及在人脑参考图上绘制SGSE的能力。这些工具既适用于发育中的大脑，也适用于成年人的大脑。

有一点需要注意brainImageR的一个主要优势是能够交叉引用艾伦大脑图谱中的两个不同的数据集:

microdissected组织:显微解剖组织转录数据集。这组基因被用来识别特定组织中存在哪些基因。
一般脑区: Allen Brain Atlas参考图中提到的区域。该集合用于在人脑地图上绘制最终的SGSE。

这两个数据集并不是1:1的关系。作为一般规则，将结合多个微解剖组织以生成在一般脑区参考图谱上绘制的剖面。我们将这两个数据集称为任意一个microdissected组织或一般脑区在整个小插图中清楚地区分正在查询的两个数据集。

1.0:准备数据

SGSE分析直接对基因列表进行分析，例如从差异表达分析中返回的基因列表。我们提供了两个数据集来检查发育中的丘脑腹侧的SGSEvth或者成年海马体臀部．

数据(vth)长度(vth)#> [1] 1389头(vth)#> [1] " a_32_p3431 " " pitx2 " " pmch " " calcr "#> [5] " a_32_p183652 " " pmchl2 "

数据(hipp)长度(hipp)#> [1] 1302头(hipp)#>[1]“neurod2”“bhlhe22”“neurod6”“shisa6”“slc17a7”“fndc1”

(可选)将基因名称转换为人类基因符号

brainImageR人类基因符号格式的基因名称。如果你的基因不是这种形式，它们必须首先被转换。网上有很多实用工具，比如DAVID Bioinformatics的GeneIDConversion。下面我们将介绍如何使用BiomaRt实现这一功能。

###填写这个

1.1:空间基因集富集

SGSE的第一步是将您的查询基因列表与已知在死后人脑中表达的基因进行比较microdissected组织使用SpatialEnrichment．这里有三个重要的论点SpatialEnrichment．

SpatialEnrichment参数:

基因:常见人类基因符号查询基因列表。
refset:用户将选择是否基因与发育中的人类或成年人相比通过分配refset到“发育中的”或“成人的”。
代表:最终的显著性估计值由fisher精确检验或自举原始数据确定。如果您选择自举，增加迭代次数或“次数”将增加分析的灵敏度。对于最初的探索性分析，建议将该值设置为低值(例如:20)。这将允许你评估不同的条件和基因集。我们建议，从最后的分析来看代表增加到一个能够在Bonferroni校正后成功识别显著比较的数字(发育= 6540次，成人= 3680次)。

复合< -SpatialEnrichment（基因=vth,代表=2，refset =“发展中”）

此外，您可以输入用户定义的背景列表进行更细致的分析。

背景:用于执行用户定义的背景校正的常见人类基因符号的基因列表。

1.2:计算显著性

SGSE的第二步是计算观测到的折叠变化与随机概率的显著性microdissected组织与testEnrich．
testEnrich只需要的输出SpatialEnrichment来运行。如果使用method = " fisher "则调用一个标准的fisher精确测试。如果使用method = " bootstrap "， p值将从原始数据中估计出来。

res < -testEnrich(复合,方法=“雪”）

此时保存数据是一种很好的做法。

保存（列表=c（“复合”，“res”)，文件=“/ mydir / myfile.rda”）

生成的表testEnrich报告所有测试的浓缩分数microdissected组织以及原始和调整后的p值。这些值可以用来确定准确的microdissected组织在基因列表中被过度或不足代表的基因。

输出testEnrich：

计数。样本:重叠查询基因列表和microdissected组织基因列表
计数。随机:随机基因列表和的平均重叠microdissected组织基因列表
FC:样本和随机之间的折叠变化
P-value:原始p值
p-adj:罗斯福修正的p值
abrev:由Allen Brain Atlas参考提供的组织名称的缩写。这个缩写可以作为输入到艾伦脑图谱参考图，以确定组织的确切位置一般脑区．它也可以作为输入GetGenes来确定你要查询的基因列表中哪些与特定组织重叠。
结构:组织全名。

res < -res (订单(res＄足球俱乐部,减少=真正的),)头(res)# >计数。样本计数。随机概率。比值pvalue padj abrev#> MRF 512 72.5 1.804541 1.066190e-23 8.955997e-22 MRF#> InM 533 76.5 1.932627 1.873317e-29 1.648519e-27 InM#> LHAa 435 77.0 1.417644 8.252459e-09 4.621377e-07 LHAa#>副总统344 61.5 1.014722 8.237702e-01 1.000000e+00副总统#>信噪比409 74.5 1.254777 2.195390e-04 8.342482e-03信噪比#> DMH 369 68.0 1.091634 1.639891e-01 1.000000e+00 DMH#> FC结构中脑网状形成#> InM 6.967320髓质插层核LHAa 5.649351下丘脑外侧，前部腹侧苍白球#> SNR 5.489933黑质网状部分#> DMH 5.426471背内侧下丘脑核

结果来自testEnrich可以很容易地用PlotEnrich

PlotEnrich(res)

最富有的人之一microdissected组织是“LHAa”，即外侧下丘脑区，前部。让我们看看在第v组和LHAa组织之间有哪些基因重叠。

vth_lha_overlap < -GetGenes(vth复合,tissue_abrev =“LHAa”）长度(vth_lha_overlap)#> [1] 459

然后使用GO术语充实包如clusterProfiler我们可以根据这些重叠的基因来确定哪些GO术语得到了丰富。

' ' ' {r, message=FALSE, warning=FALSE,fig。Width = 10, fig.height = 5}

库(clusterProfiler)

库(org.Hs.eg.db)

vth_go <-富贵go(基因= vth_lha_overlap，

OrgDb = org.Hs.eg.db，

keytype = '符号'，

pvalueCutoff = 0.05，

qvalueCutoff = 0.05)

dotplot (vth_go showCategory = 30)

' ' '

1.3:绘制大脑图

接下来，我们想看看相邻的大脑区域是否共享SGSE估计。为此，我们将使用CreateBrain合并所有的microdissected组织回来testEnrich所以每一个一般脑区存在于Allen脑图谱参考图中的神经网络由各自的底层组织支持。

如上所述，请注意一般大脑区域在艾伦大脑图谱参考图和microdissected组织存在于Allen Brain Atlas转录数据集中的基因并不具有1:1的关系。因此，参考图中有些区域没有转录信息支持，而有些区域则有多个组织支持。

CreateBrain从SpatialEnrichment而且testEnrich作为输入。还有另外两个论点需要考虑。

CreateBrain参数:

切片:来自发育中或成人大脑的图像。对于发育中的大脑和成人大脑来说，选择都是1-10。
Pcut:考虑a的p值阈值microdissected组织被充实或耗尽

由于我们最初发现LHAa很有趣，让我们看看发育中的大脑包含哪些部分一般大脑区域由拉萨组成。

tis_in_region(复合,“LHAa”）#>切片区域#> 16 THM#> 2 7 THM

切片6和7都有丘脑中lha (THM)的相关信息。让我们使用切片6进行下游分析。

复合< -CreateBrain(复合,res,片=5，pcut =0.05）

一旦microdissected组织是否合并成相应的一般大脑区域时，可绘制图像。

PlotBrain(综合)

从这张图上看，丘脑确实富集了第v组基因。有趣的是，周围的区域也丰富了这一套。通过参考艾伦大脑图谱我们可以看到这些一般大脑区域比如壳核(Pu)和尾状核(Ca)。

请注意，您可以直接引用艾伦大脑图谱或使用available_areanames以确定可用的列表一般脑区要查询的名称。

available_areanames(复合,片=6）# >[1]“BNST”“CP”“Ca”“光”“HTH”“工业区”“教育法”“兆欧”“MZ”“Pu”# >[11]“R”“SG”“SN”“SP”“深圳”“三”“VA”“登陆”“alCP”“peCP”>[21]“peMZ”

让我们仔细看看一般脑区Putamen的用法和样例:使用tis_set我们可以回溯并确定是哪一种microdissected组织支持最终的颜色代码在一个给定的领域感兴趣。

tis_set(复合,area.name =“Pu”，片=6）#> abrev structure_name#> 1 Pld硬膜外侧部#> 2硬膜中腹部#> 3 PuC尾壳核4 PuR硬膜口侧

现在我们可以回去观察基因重叠microdissected组织在壳层内。这里我们关注的是硬膜的中腹侧部分

vth_pld_overlap < -GetGenes(vth复合,tissue_abrev =“结构”）长度(vth_pld_overlap)#> [1]##vth_go <-富贵go(基因= vth_pld_overlap，## OrgDb = org.Hs.eg.db，## keytype = '符号'，## pvalueCutoff = 0.05，## qvalueCutoff = 0.05)# # dotplot (vth_go showCategory = 30)

GO术语“激素活动”在与LHAa和Pmv的比较中都出现了。也许这些组织之间有一个共同的通路。让我们使用whichtissues观察Pmv中具有激素活性的基因是否也存在于LHAa中。

捕获与激素活性相关的基因#vth_go2 <- data.frame(vth_go)#vth_match <- vth_go2$Description == "荷尔蒙活动"#vth_pmv_hormone <- vth_go2[vth_match， "geneID"]#vth_pmv_hormone <- unlist(strsplit(vth_pmv_hormone，"/"))#识别这些基因在所有组织中的存在#vth_pmv_hormone <-哪个组织(vth_pmv_hormone, refset = "developing")# vth_pmv_hormone_tis [1:10]# LHAa中存在哪些基因(1)#all <- vth_pmv_hormone e_tis[，"LHAa"]#vth_pmv_hormone[all == 1]

事实上，所有参与Pmv中激素活动的基因也在LHAa中表达。

使用上述功能，brainImageR为我们提供了一种查询死后人脑SGSE的简便方法。我们计算了基因重叠富集的意义，并用人脑图像可视化了这些富集。现在让我们继续从数据集预测开发时间。

第二节:发育时间点预测

2.0:准备数据

brainImageR的另一个功能是参考死后人脑预测样本的发育时间点。这个分析需要一个归一化表达式矩阵作为输入。这个矩阵的列应该是样本，行应该是基因符号格式的基因名。中提供了一个示例dat．

数据(dat)昏暗的(dat)#> [1] 10192头（rownames(dat))#>[1]“a2m”“nat2”“acat1”“ada”“adrb2”“adrb3”头（colnames(dat))# >[1]“NPC.1”“NPC.2”“NPC.3”“NPC.4”“Neurons.5”“Neurons.6”国家< -do.call（“rbind”，strsplit（colnames(dat),“。”，固定的=真正的)),1］

2.1:预测发育时间

在最简单的情况下，人们可以通过提供完整的艾伦大脑图谱数据集来预测发育时间predict_time．多项研究表明，体外获得的神经元主要再现了产前发育。因此我们提供了额外的灵活性predict_time在产前获得更高的分辨率。这是通过将分析限制在艾伦大脑图谱中的样本中来完成的，这些样本来自给定的一类数据。你可以看到我们使用哪些数据集进行了预计算availabledatasets．

# availabledatasets ()

让我们从默认设置开始，它将使用所有可用的样本来执行时间预测。

时间< -predict_time(dat,minage =8，maxage =40）

PlotPred将显示覆盖在Allen Brain Atlas参考集(aba)预测之上的预测，以显示模型在起始数据集上的表现。这个图使用户能够直观地了解模型是如何执行的

PlotPred(时间)

正如我们所看到的，使用所有样本，预测在所有时间点上是线性的。与大多数体外神经元研究一样，我们的样本与产前样本聚类。虽然我们的模型很好地预测了所有年龄段的时间，但存在一个问题，即产前样本之间的预测时间间隔很小。为了在这段时间内提供更高的分辨率，让我们限制分析在预测中只使用产前样本。

如果我们选择“产前”，这将限制预测仅那些<怀孕后40周的样本。

#time <- predict_time(dat,dataset = "产前")# PlotPred(时间)

现在我们可以看到，该模型在产前时间点具有更高的分辨率。请注意，此模型不应用于出生后样本，因为(与默认模型相反)它解决出生后时间点之间差异的能力较弱。

现在我们已经有了一个用于检查产前发育样本的模型，让我们将npc与神经元进行比较。

#time2 <- data.frame(pred_age = time@pred_age, state)#time2$state <- time2$state, c("NPC"，" neuron "))# ggplot (time2 aes(状态,pred_age)) ++ # geom_boxplot ()# ylab(“预计时间，受孕后几周”)+#实验室(title = "预测发育时间，\ndataset =产前")

正如预期的那样，神经前体细胞在发育时间上比神经元更年轻。在与此包相关的手稿中，有预测死后和体外衍生神经元发育时间的额外示例，显示了的效用predict_time跨数据集和类型。

还有其他选项predict_time允许用户进一步细化他们的分析。

predict_time参数:

dat:一个规范化的表达式矩阵，其中列是样本，行是由基因符号定义的基因。
dataset:如果需要，用户可以从预先计算的模型工作。使用availabledatasets看看有什么选择。默认值= " all "。
基因列表:如果你想将预测限制在某个基因子集，你可以在论点中保留你的完整数据集dat在这里输入限制基因列表。
minage:构思后最少几周即可运行预测。
maxage:运行预测的最长时间。
组织:将数据集限制为感兴趣的组织。
minrsq:(0 - 1)。minrsq与模型的预测强度相关。减小该值以允许计算较弱的模型。

使用这些额外的选项，我们在预测时有了更大的灵活性。例如，假设我们生成了与成人杏仁核功能相似的神经元，因此更喜欢最能代表该特征的模型。我们可以设置minage到40岁组织并重新计算我们的预测。

#time <- predict_time(dat,minage = 40, tissue = "AMY")

brainImageR

莎拉链接器

2018-10-31