全局内核和局部内核的效果

高斯核宽度σ

另一个重要的参数DiffusionMap是高斯核宽度σσ\ (\ \)),决定数据点之间的转移概率。的默认调用命运- - - - - -DiffusionMap(数据)又名DiffusionMap(数据、“当地”))—使用本地σ每个单元,来源于每个单元周围的局部密度估计。

使用1.0默认值,Sigma = 'global',估计sigma使用启发式。也可以手动指定此参数来调整结果。上面解释的特征向量图将显示持续下降,而不是急剧下降,如果数据集太大或σ选的太小了。

中详细解释了西格玛估计算法哈格威尔第,比特纳和泰斯(2015).简而言之,它的工作原理是在局部密度的对数-对数图的斜率中找到一个最大值σ

图书馆(命运)数据(guo_norm)

使用find_sigmas

提供了该过程的有效变体find_sigmas.该函数确定给定数据子集的最佳西格玛,并为a提供默认西格玛DiffusionMap调用。由于起点不同,得到的sigma与上面不同:

## [1] 10.8946

得到的扩散图的近似值取决于所选的西格玛。请注意,西格玛估计启发式只能找到局部最优值,甚至启发式的全局最优值也可能不适合您的数据。

参考文献

哈格威尔第,拉莉,弗洛里安·比特纳,法比安·j·泰斯,2015。区分数据的高维单细胞分析的扩散图生物信息学,没有。在修订。