斑点阵列打印运行质量控制
二八年四月十五日
艾格尼丝Paquet1,安德里亚·巴尔扎克1(Jean)杨怡华2
1.加州大学旧金山分校医学部功能基因组学核心中心
paquetagnes@yahoo.com
2.澳大利亚悉尼大学数学与统计学院
内容
本文档描述了arrayQuality中提供的各种函数,这些函数可用于在将幻灯片用于实验之前评估打印质量。这些功能是专门为随机9mers杂交和QC杂交设计的,这是在制造自己的阵列的设施中进行的。对评估任何其他类型的阵列杂交质量控制质量感兴趣的用户应参考基本用户指南,该指南可从主要在线帮助页面访问。1.印刷质量控制
打印运行完成后,有必要验证结果数组的质量。这可以通过对新幻灯片使用两种杂交来实现。第一种类型的杂交,我们称之为“9mers hyb”,使用小寡核苷酸(随机9-mers),它将杂交到每个探针。这种杂交将有助于确定斑点形态的质量以及斑点寡核苷酸的存在或不存在。生成的数据将用于创建所有缺失点的列表。
第二种杂交,我们称之为质量控制杂交(QCHyb),使用来自预定义细胞系的mRNA(例如,肝脏vs. pool, K562 vs.来自Stratagene的人类通用参考库)。这些杂交可以用来作为一个更定量的描述幻灯片。同样的比较杂交做了不同的印刷运行,评估其再现性。qchyb还用于验证GAL文件的准确性,缺失点的数量,绑定容量,背景信号强度…
arrayQuality软件包提供了特定的工具来帮助评估9-mers和QC杂交的幻灯片质量。
2.9-mers杂交过程
包中评估9mers杂交质量的图形函数为PRv9mers()。它使用一个命令行脚本运行。使用它:
- 将所有9-mers杂交gpr文件从相同的打印运行(相同的GAL文件)复制到一个目录。
- 使用R GUI菜单将R工作目录更改为包含gpr文件的目录。
- 加载arrayQuality:
在R提示符下输入:
库(arrayQuality)
- 运行函数类型:
PRv9mers (prname = 12毫米)。
prname参数表示打印运行的名称。有关其他参数的详细信息,请参见联机帮助文件。
2.1结果
PRv9mers ()提供了以下结果:
- 每张测试幻灯片的诊断图为.png格式的图像
- 一个Excel文件(通常命名为9Mm9mer.xls,其中9Mm是打印运行的名称,传递给prname)包含幻灯片上的每个位置:
- 点的名称和ID
- 存在或不存在的概率(p来自EM算法)。如果几个文件一起测试,您将有可能出现/不出现每个文件。
如果p < 0.5,则认为没有一个斑点。
- 出席或缺席的平均概率。
- 原始信号强度(信号列)或平均原始信号强度,如果几个文件一起测试每个点。
- 一个Excel文件(通常命名为9MmMissing.xls,其中9Mm是打印运行的名称,传递给prname)只包含丢失探测的信息:
- 点的名称和ID
- 存在或不存在的概率(p来自EM算法)。如果几个文件一起测试,您将有可能出现/不出现每个文件。
如果p < 0.5,则认为没有一个斑点。
- 出席或缺席的平均概率。
- 原始信号强度(信号列)或平均原始信号强度,如果几个文件一起测试每个点。
- 一个文本文件(通常命名为9MmQuickList.txt,其中9Mm是您的打印运行的名称,传递给prname)包含缺失的探测id,每个都在单独的行中。这个文件可以在任何文字处理程序中打开。
2.2诊断图描述
图1显示了一个典型的9-mers杂交的例子。这张图片被分成了5个面板
- 第一列(左)表示对数强度的箱线图,按板(上)和按打印尖端组(下)。在这个例子中,你会注意到在按板块划分的箱线图上(左上角),板块44和48的强度较低,范围较宽。这两个板块都包含由Operon设计的大部分空控件。
- 中心地块:强度的空间地块。这有助于定位缺失的位置。色标反映信号强度,图中颜色越深,信号越强。缺失的点用白色表示。在图3空间图中,右上角的白点来自于空点。
- 右列:前景和背景测井强度的密度图。
- 前景密度图:应由2个峰组成。低强度区域的一个较小的峰值包含缺失点和阴性控制点,一个较高的峰值代表其余的点(探针)。图中表示了EM算法估计的存在点和不存在点(不包括空控件)的数量。
- 背景密度图:低强度区域有一个峰值。如果幻灯片质量好,背景峰值不应该与与大量数据对应的前景峰值重叠太多。
密度图用于比较前景和背景峰,使用x轴尺度。它们应该被清楚地分开。缺失点的数量应该很低。缺失点id稍后可能会被纳入分析,例如在线性模型中降低它们的权重。2.3的例子
本例使用UCSF功能基因组学核心设施中执行的9-mer杂交数据。此打印运行是使用Operon版本2鼠标寡核苷酸创建的。
>库(arrayQuality)
> datadir <- system。文件(“gprQCData”,包=“arrayQuality”)
> PRv9mers(帧= " 12 mm250。探地雷达”,路径= datadir prname = " 12毫米”)
图1:9-mers杂交诊断图示例
3.质量控制杂交
9-mers杂交有助于验证寡核苷酸在载玻片上已被正确发现。下一个印刷质量控制步骤将是:
1.检测与其他打印运行相比的总体信号强度的差异
一个。70-mers寡核苷酸杂交
b。选择几个测试载玻片,以确保在盘片上发现相同数量的材料,因为使用同一个孔对一个探针打印将生成255个载玻片。qchyb从打印开始的一张幻灯片开始,从中间一张幻灯片开始,从末尾一张幻灯片开始(例如,功能基因组学核心设施中的数字20,100和255)。
2.检查GAL文件是否正确生成,即在打印过程中检查是否有错误的顺序或方向。
3.再现性:
验证新打印的质量的一个好方法是将已知样本杂交到新的幻灯片上。然后,我们可以将新幻灯片的信号强度与现有数据进行比较,并检查信号是否有损失。已知样本的对数比(M)在打印过程中应该相似。用于QCHybs的样本示例包括人类参考池、小鼠肝脏、小鼠肺和染料交换。
包中对QCHybs进行质量评估的功能为PRvQCHyb ().它使用单行脚本运行。使用它:
- 复制QCHybs gpr文件从同样的称(相同的GAL文件)在一个目录。
- 如第1节所述,将R工作目录更改为包含gpr文件的目录。
- 在R中输入:
>
PRvQCHyb (prname = 9毫米)
在哪里prname是打印运行的名称。有关其参数的详细信息,请参阅在线手册。
3.1结果
PRvQCHyb ()为每一张测试过的幻灯片返回一个。png格式的诊断图。
在整个文档中,我们将使用表1中描述的颜色代码来突出显示控制点。
积极的控制
|
红色的
|
空的控制
|
蓝色的
|
消极的控制
|
海军蓝色
|
探针
|
绿色
|
失踪的地方
|
白色 |
表1:arrayQuality中使用的颜色代码
限制:
目前,PRQCHyb ()只支持小鼠基因组(Mm)。
3.2诊断图描述
图2显示了一个很好的QCHyb打印运行示例
- 原始M值的ma图。没有执行背景减法。彩色线代表每个印尖组的黄土曲线。红点突出了相应加权值小于0的点。用户可以创建自己的称重方案或功能。在MA-plot中要寻找的是点的饱和度和黄土曲线的趋势,这是要执行的归一化量的一个指标。
- 没有背景减法的打印尖端组的原始M值箱线图。
- 原始M值排序的空间图(无背景减法):每个点根据其M值进行排序。我们使用蓝色到黄色的颜色刻度,其中蓝色代表较高的等级(1),黄色代表较低的等级。缺失的点用白色方块表示。
- A值的空间图。颜色表示信号强度的强弱,即颜色越深,信号越强。缺失的点用白色表示。
- Cy5和Cy3通道的信噪比(SNR)直方图。信号的均值和方差被打印在直方图的顶部。此外,还突出显示了不同控制类型(状态)下信噪比分层的叠加密度。它们的配色方案如表1所示。信噪比是染料问题的一个很好的指标。负控件和空控件的密度线应该更近,几乎重叠。
- 探针的m值的比较,已知从测试阵列的差异表达与在以前的杂交中获得的平均m值。这个图的目的是验证印行的再现性。虚线是对角线(没有变化)和+2/-2折叠变化线。每个探测都用一个数字表示,并在MmDEGenes.xls文件中进行了描述。大多数斑点应该位于+2/-2折叠变化区域之间。如果技术是完美的,你应该在对角线上看到一条直线。如果任何探针脱离这个区域(这里是29号),您可以在MmDEgenes.xls的探针列表中查找它的编号,并获得有关它的更多信息。
- 控件A值的点图,没有背景减法。超过3个重复的对照在y轴上表示,配色方案如表1所示。阳性对照的强度应在高强度区域,阴性和空对照应在低强度区域。阳性控制范围和阴性/空控制范围应该分开。复制点信号应该很紧。
3.3的例子
本例的数据由UCSF的功能基因组学核心设施提供。我们已经测试了9Mm打印版的137号幻灯片。此打印运行使用Operon版本2鼠标寡核苷酸。结果如图2所示。
>库(arrayQuality)
> datadir <- system。文件(“gprQCData”,包=“arrayQuality”)
> PRvQCHyb(帧= " 9 mm137。gpr ", path=datadir, prname="9Mm")
图2:印行质量控制杂交诊断图