σ
另一个重要的参数DiffusionMap
是高斯核宽度σ
(σ\ (\ \)),决定数据点之间的转移概率。的默认调用命运- - - - - -DiffusionMap(数据)
又名DiffusionMap(数据、“当地”)
)—使用本地σ
每个单元,来源于每个单元周围的局部密度估计。
使用1.0默认值,Sigma = 'global'
,估计sigma使用启发式。也可以手动指定此参数来调整结果。上面解释的特征向量图将显示持续下降,而不是急剧下降,如果数据集太大或σ
选的太小了。
中详细解释了西格玛估计算法哈格威尔第,比特纳和泰斯(2015).简而言之,它的工作原理是在局部密度的对数-对数图的斜率中找到一个最大值σ
.
提供了该过程的有效变体find_sigmas
.该函数确定给定数据子集的最佳西格玛,并为a提供默认西格玛DiffusionMap
调用。由于起点不同,得到的sigma与上面不同:
## [1] 10.8946
得到的扩散图的近似值取决于所选的西格玛。请注意,西格玛估计启发式只能找到局部最优值,甚至启发式的全局最优值也可能不适合您的数据。
调色板(cube_helix(6))情节< -拉普兰人(列表(“本地”,5,轮(optimal_sigma((),2),One hundred.),函数(σ)情节(DiffusionMap(guo_normσ),1:2,主要=粘贴(“σ= 'σ),col_by =“num_cells”,draw_legend =假))do.call(gridExtra::grid.arrange,c(情节,ncol =2))
哈格威尔第,拉莉,弗洛里安·比特纳,法比安·j·泰斯,2015。区分数据的高维单细胞分析的扩散图生物信息学,没有。在修订。