sam 文件第二列flag含义:
1 : 代表这个序列采用的是PE双端测序
2: 代表这个序列和参考序列完全匹配,没有错配和插入缺失
4: 代表这个序列没有mapping到参考序列上
8: 代表这个序列的另一端序列没有比对到参考序列上,比如这条序列是R1,它对应的R2端序列没有比对到参考序列上
16:代表这个序列比对到参考序列的负链上
32 :代表这个序列对应的另一端序列比对到参考序列的负链上
64 : 代表这个序列是R1端序列, read1;
128 : 代表这个序列是R2端序列,read2;
256: 代表这个序列不是主要的比对,一条序列可能比对到参考序列的多个位置,只有一个是首要的比对位置,其他都是次要的
73 = 64+8+1 (R1匹配上,R2没有匹配上)
153 = 128+16+8+1(R2比对到负链接,R1没有匹配上)
97 = 64+32+1 (R2比对到负链,R1不是完全匹配)
99 = 64+32+2+1 (R2比对到负链,R1完全匹配)
147 = 128+16+2+1 (R2完全匹配到负链)
145 = 128+16+1 (R2比对到负链,R1不是完全匹配)
83 = 64+16+2+1 (R1完全匹配到负链)
163 = 128+32+2+1(R2完全匹配,R1比对到负链)
M alignment match (can be a sequence match or mismatch) insertion to the reference
D deletion from the reference N skipped region from the referenceS soft clipping (clipped sequences present in SEQ)
H hard clipping (clipped sequences NOT present in SEQ)P padding (silent deletion from padded reference) sequence match
还有一些可选的tag,格式为tag:type:value 例如:NH:1 代表的是read alignment的个数,表示这个read只mapping到基因组一次