前言

想象一个没有参考基因组的世界。每当我们收到新的RNA-seq数据时，我们都需要通过汇编器运行它以识别表达的序列。然后，我们需要检查每个序列，以确定其可能的函数，例如基于序列基序。这个过程类似于单细胞数据分析中的当前实践。只需用单元格，组件与簇和细胞类型替换读物。典型的从业者将希望他们的簇是感兴趣的生物状态的合理代理，并且他们对簇的手动注释是准确的。这样的“手工”过程很难复制并扩展到涉及更多不同细胞类型的较大数据集。

该解决方案是执行自动单元格类型注释，又称单元格类型分类（或偶尔，“标签转移”）。这些方法将新数据集中的单元格与已知单元格类型的策划参考曲线进行比较，将每个新单元格分配给其表达式配置文件与最相似的参考类型。这使用户可以跳过他们的数据的平凡注释，直接跳到有趣的问题 - 我的细胞类型是否会在治疗过程中发生丰富或表达？现有人群中是否有有趣的子结构？在这方面，自动注释方法是单细胞字段等同于基因组对齐器，我们预计前者也将成为单细胞数据分析的标准程序。

这本书涵盖了辛格，一种自动注释方法的实现。如果您想对不同注释方法进行调查 - 本书不适合您。如果您想创建手工制作的群集定义 - 这本书不适合您。（阅读另一个相反。但是，如果您厌倦了手动注释单细胞数据，并且想在生活中做得更好，请继续阅读。

用单人分配单元类型

用单人分配单元类型

前言