癌症标本的全基因组分析是常见的,研究人员经常在后来的研究中共享或重复使用标本。公共数据库中重复的表达式配置文件如果未被发现,将影响重新分析,即所谓的“doppelgänger”效应。doppelgangR包在成对表达谱相关性中使用批量校正和异常值检测,以准确识别轮廓足够明显的癌症类型的重复轮廓。它适用于核苷酸水平序列数据不可用的情况,即使是通过不同的微阵列技术或通过微阵列和日志转换RNA-seq数据的组合来分析重复样本的标本也有效。