GCT
所述 GCT 文件格式是用于描述处理的基因表达或 RNAi 数据,典型地从微阵列芯片分析得到的制表符分隔的文本文件格式。该数据排列为每行一个带注释的基因或探针,每列一个芯片样品(超出注释列)。例如:
#1.2
22215 2
Name Description Tumor_One Normal_One
1007_s_at DDR1 -0.214548 -0.18069
1053_at RFC2 0.868853 -1.330921
117_at HSPA6 1.124814 0.933021
121_at PAX8 -0.825381 0.102078
1255_g_at GUCA1A -0.734896 -0.184104
1294_at UBE1L -0.366741 -1.209838
在此示例中,第一行指定 GCT 文件规范的版本,在本例中为 1.2
。第二行指定数据行数(22215
)和样本数(2
)。标题行指定两个注释列(芯片探针组标识符为 Name
,探针组覆盖的基因符号为 Description
)和待测样品的名称(Tumor_One
和 Normal_One
)。标题之外的每行数据列出单个探针组标识符(在这种情况下,Affymetrix 基因芯片探针组),其相应的基因符号(如果存在),以及每个样品的标准化值。样品数据值将根据测定类型和标准化方法而变化,但通常是带符号的浮点数值。