我有两个文件 第一个是包含 unigene 序号的文件,名称为一个序号一行
CL79.Contig98_All
Unigene56947_All
CL323.Contig1_All
另一个文件里面是 All-Unigene.fa 的文件,里面数据很大,其中第一个文件的序号以及对应的序列在 All-Unigene.fa 可以找到格式为.fa 格式,如下所示
CL323.Contig1_All CTTTTTTCCAGGGAGGTGGCAGCAGTCTACGTGCTCGTTATGATCGTTTG GAATGACAAATATTTTGCAAATACTGTGGGTTTCTGTGGAATAACCTTGC TTGATTTTGCAGGTTAAACCAGCTGCAGCTGGTTTTGTTTAACACATTGT TCTCTTTCTGTAGATAGAAACAACCATG
CL447.Contig1_All AGAGAAACCTGGTCAGTTGGCTGGAGGTTTCAGCCAGAGAAGGTCTTTTA TACTGTTGTATTTGAATTTTGTGCACTTAGGCTGACTCTTCCTCTGTGTG CTGTAGGATGGAGGTGTCCTGCCTGGAGCTGGCGTTGGAGGGTGAGCGGC TCTGTAAGGTGGGCGACTACAGAGCAGGCGTCTCCTTCTTTGAAGCCGCC ATCCAGGTGGGCACAGAGGACCTGCAGGTGCTAAGTGC
我想要通过序号文件找到它在 All-Unigene.fa 文件查找到对应的序列,然后把 All-Unigene.fa 中的完整的一条输入新建的文件里面。
实验室最近新开始搞一部分生物信息的东西,零基础开始学习,头秃,请大神帮助。