结直肠癌拷贝数变异与基因表达数据整合分析文献综述

 2023-02-23 22:46:58
{title}{title}

背景

结直肠癌是人类主要恶性肿瘤之一,其发病率和死亡率分别位于第三位和第四位,每年有 120 万新确诊的病例,并且有超过 60 万名患者死于结直肠癌[1]。结直肠癌发病率在 50 岁以下年龄段较低,但会随着年龄的增大而增加。发达国家的结直肠癌发病中位年龄为 70 岁[2]。该病在欧洲、北美和大洋洲较为多发,而在南亚、中亚及非洲则比较少见[3]。

自从二十世纪 80 年代以来,由于早期的发现与治疗,一些发达国家的结直肠癌死亡率正在不断下降。但在医疗条件不好的地区,如中美、南美和中国的农村地区,结直肠癌的死亡率仍在不断上升中[3,4,5]。

在过去的几十年中,很多国家的结直肠癌生存率都有所提高。尤其是在一些高收入国家,如在美国、澳大利亚、加拿大及一些欧洲国家的结直肠癌 5 年生存率已经达到了 65% 以上。但相对的,在一些低收入国家这个值还不到 50%[2,6,7]。

结直肠癌的预计生存期会随着发病年龄的增大而减少。而对于年轻人,女性的生存率高于男性。探讨结直肠癌基因表达与预后的关系,可以为结直肠癌治疗提供参考。

众所周知,相同的癌症在不同个体上的发病表现不同,相同的发病表现却需要不同的诊断和治疗方案;癌症的不同分期虽然反映了癌症的一些特性,同时也能帮助临床医生制定针对特定分期的治疗方案,但是由于分子水平的变化导致的个性差异性使得相同的病理分期用相同的治疗方案却得到了不同的治疗结果,这一现象的根本原因就是目前无论是科学家还是临床医生对特定癌症在人体内部发生、发展、转移的分子机制了解的不多,不能达到个体化治疗的阶段[8]。应对这一问题的方法就是在大量临床样本的支持下,在癌症的某一分子水平上利用生物信息学的方法进行系统研究[8]。

染色体变异在肿瘤发生中被大量观察到,它包括结构变异和拷贝数变异。拷贝数变异在诸如在乳腺癌、前列腺癌、卵巢癌、肺癌、和结直肠癌等多种肿瘤细胞中都很常见。多个研究表明,基因拷贝数变异在肿瘤的发生和发展中扮演着一个重要角色。在不同的肿瘤中,拷贝数变异的数量、大小和幅度都是非常不同的,并且可能反映肿瘤逃离正常保护细胞环境下的个体差异[8]。探讨拷贝数变异有助于发现它们在结直肠癌中扮演的角色。

2005年底,美国国立卫生研宄院(National Institutes of Health, NIH)组织美国国立癌症研究院(National Cancer Institute, NCI)和国立人类基因组研宄院(National Human Genome Research Institute, NHGRI)共同启动开展了为期 3年耗资1亿美元的癌症基因组图谱计划(The Cancer Genome Atlas, TCGA)试验项目。TCGA试图利用基因组分析技术尤其是大规模的基因组测序,将人类全部癌症的基因组变异图谱绘制出来,并进行系统的分析,旨在找到所有致癌和抑癌基因的微小变异,了解癌细胞发生、发展的机制,在此基础上取得新的诊断和治疗方法,最后勾画出新型的预防癌症的策略[8]。目前TCGA收集了43种癌症,131019个样本,mRNA/microRNA,拷贝数变异,突变等大规模数据,为临床肿瘤研究者提供了大量有价值的信息。

目的

研究目的在于利用TCGA数据库数据研究结直肠癌拷贝数变异、基因表达与临床参数三者的关系,找出与结直肠癌相关的基因

内容和方法

1)从TCGA下载结直肠癌拷贝数、基因表达、临床参数数据,处理并整合数据;

2)利用统计学分析方法对拷贝数数据进行分析,识别出结直肠癌中的显著的拷贝数变异基因;

3)利用T检验对基因表达数据中癌组织与正常组织样本之间的表达区别,识别出在结直肠癌中存在差异表达的基因;

4)利用spearman方法分析结直肠癌基因拷贝数变异与基因表达的相关性;

5)利用Cox比例风险模型分析结直肠癌基因表达与预后的关系;

6)探寻拷贝数变异和差异表达基因存在相关性的且表达与预后也存在关系的基因的医学意义。

以上的T检验、spearman分析和Cox比例风险模型均使用R语言完成。R语言是免费开源的环境平台,适合统计计算和图形化显示计算结果。R语言平台最大的优势就是多元的软件包,这些软件包都是世界上不同领域的科研人员幵发和维护的。R语言平台非常适用于高校科研并且在涉及到生物信息分析的领域具有较高的权威。

结果

筛选出结直肠癌中拷贝数变异、基因表达和预后三者存在关系的基因,期望为结直肠癌诊断与个性化治疗提供参考,推动结直肠癌基础与临床研究。

创新点

整合基因组水平、mRNA水平及临床数据,从基因组水平、转录水平共同探索与结直肠癌发生发展相关的基因。

参考文献:

[1]Ferlay, J, Shin, HR, Bray, F, Forman, D, Mathers, C, and Parkin, DM.GLOBOCAN 2008cancer incidence and mortality worldwide: IARC CancerBase No 10.International Agency for Research on Cancer,Lyon;2010http://globocan.iarc.fr. ((accessed April 19, 2013).)

[2]Siegel, R, DeSantis, C, Virgo, K et al.Cancer treatment and survivorship statistics, 2012.CA Cancer J Clin.2012;62:220241

[3] Center, MM, Jemal, A, Smith, RA, and Ward, E.Worldwide variations in colorectal cancer.CA Cancer J Clin.2009;59:366378

[4]Bosetti, C, Levi, F, Rosato, V et al.Recent trends in colorectal cancer mortality in Europe.Int J Cancer.2011;129:180191

[5]Guo, P, Huang, ZL, Yu, P, and Li, K.Trends in cancer mortality in China: an update.Ann Oncol.2012;23:27552762

[6]Brenner, H, Bouvier, AM, Foschi, R..., and the EUROCARE Working Group.Progress in colorectal cancer survival in Europe from the late 1980s to the early 21st century: the EUROCARE study.Int J Cancer.2012;131:16491658

[7]Sankaranarayanan, R, Swaminathan, R, Brenner, H et al.Cancer survival in Africa, Asia, and Central America: a population-based study.Lancet Oncol.2010;11:165173

[8]邓祯祥. 整合卵巢癌拷贝数变异和差异表达基因的生物信息学分析[D].广州:南方医科大学.2014年

学生签名:周园 2016 年 3 月 23日

指导教师意见:

指导教师签名: 年 月 日

所在教研室审查意见:

负责人签名: 年 月 日

填写说明

1.指导教师意见填写对文献综述的评语,对本课题的深度、广度及工作量的意见和对论文结果的预测;

2.所在教研室审查意见包括对指导教师意见的认定和是否同意开题等。

中国药科大学本科生毕业论文(设计)开题报告

姓名

周园

学号

1247920

专业

信管

指导教师

张丹丹

课题名称

结直肠癌拷贝数变异与基因表达数据整合分析

课题性质

radic; 基础研究 应用课题 设计型 调研综述 理论研究

背景

结直肠癌是人类主要恶性肿瘤之一,其发病率和死亡率分别位于第三位和第四位,每年有 120 万新确诊的病例,并且有超过 60 万名患者死于结直肠癌[1]。结直肠癌发病率在 50 岁以下年龄段较低,但会随着年龄的增大而增加。发达国家的结直肠癌发病中位年龄为 70 岁[2]。该病在欧洲、北美和大洋洲较为多发,而在南亚、中亚及非洲则比较少见[3]。

自从二十世纪 80 年代以来,由于早期的发现与治疗,一些发达国家的结直肠癌死亡率正在不断下降。但在医疗条件不好的地区,如中美、南美和中国的农村地区,结直肠癌的死亡率仍在不断上升中[3,4,5]。

在过去的几十年中,很多国家的结直肠癌生存率都有所提高。尤其是在一些高收入国家,如在美国、澳大利亚、加拿大及一些欧洲国家的结直肠癌 5 年生存率已经达到了 65% 以上。但相对的,在一些低收入国家这个值还不到 50%[2,6,7]。

结直肠癌的预计生存期会随着发病年龄的增大而减少。而对于年轻人,女性的生存率高于男性。探讨结直肠癌基因表达与预后的关系,可以为结直肠癌治疗提供参考。

众所周知,相同的癌症在不同个体上的发病表现不同,相同的发病表现却需要不同的诊断和治疗方案;癌症的不同分期虽然反映了癌症的一些特性,同时也能帮助临床医生制定针对特定分期的治疗方案,但是由于分子水平的变化导致的个性差异性使得相同的病理分期用相同的治疗方案却得到了不同的治疗结果,这一现象的根本原因就是目前无论是科学家还是临床医生对特定癌症在人体内部发生、发展、转移的分子机制了解的不多,不能达到个体化治疗的阶段[8]。应对这一问题的方法就是在大量临床样本的支持下,在癌症的某一分子水平上利用生物信息学的方法进行系统研究[8]。

染色体变异在肿瘤发生中被大量观察到,它包括结构变异和拷贝数变异。拷贝数变异在诸如在乳腺癌、前列腺癌、卵巢癌、肺癌、和结直肠癌等多种肿瘤细胞中都很常见。多个研究表明,基因拷贝数变异在肿瘤的发生和发展中扮演着一个重要角色。在不同的肿瘤中,拷贝数变异的数量、大小和幅度都是非常不同的,并且可能反映肿瘤逃离正常保护细胞环境下的个体差异[8]。探讨拷贝数变异有助于发现它们在结直肠癌中扮演的角色。

2005年底,美国国立卫生研宄院(National Institutes of Health, NIH)组织美国国立癌症研究院(National Cancer Institute, NCI)和国立人类基因组研宄院(National Human Genome Research Institute, NHGRI)共同启动开展了为期 3年耗资1亿美元的癌症基因组图谱计划(The Cancer Genome Atlas, TCGA)试验项目。TCGA试图利用基因组分析技术尤其是大规模的基因组测序,将人类全部癌症的基因组变异图谱绘制出来,并进行系统的分析,旨在找到所有致癌和抑癌基因的微小变异,了解癌细胞发生、发展的机制,在此基础上取得新的诊断和治疗方法,最后勾画出新型的预防癌症的策略[8]。目前TCGA收集了43种癌症,131019个样本,mRNA/microRNA,拷贝数变异,突变等大规模数据,为临床肿瘤研究者提供了大量有价值的信息。

目的

研究目的在于利用TCGA数据库数据研究结直肠癌拷贝数变异、基因表达与临床参数三者的关系,找出与结直肠癌相关的基因

内容和方法

1)从TCGA下载结直肠癌拷贝数、基因表达、临床参数数据,处理并整合数据;

2)利用统计学分析方法对拷贝数数据进行分析,识别出结直肠癌中的显著的拷贝数变异基因;

3)利用T检验对基因表达数据中癌组织与正常组织样本之间的表达区别,识别出在结直肠癌中存在差异表达的基因;

4)利用spearman方法分析结直肠癌基因拷贝数变异与基因表达的相关性;

5)利用Cox比例风险模型分析结直肠癌基因表达与预后的关系;

6)探寻拷贝数变异和差异表达基因存在相关性的且表达与预后也存在关系的基因的医学意义。

以上的T检验、spearman分析和Cox比例风险模型均使用R语言完成。R语言是免费开源的环境平台,适合统计计算和图形化显示计算结果。R语言平台最大的优势就是多元的软件包,这些软件包都是世界上不同领域的科研人员幵发和维护的。R语言平台非常适用于高校科研并且在涉及到生物信息分析的领域具有较高的权威。

结果

筛选出结直肠癌中拷贝数变异、基因表达和预后三者存在关系的基因,期望为结直肠癌诊断与个性化治疗提供参考,推动结直肠癌基础与临床研究。

创新点

整合基因组水平、mRNA水平及临床数据,从基因组水平、转录水平共同探索与结直肠癌发生发展相关的基因。

参考文献:

[1]Ferlay, J, Shin, HR, Bray, F, Forman, D, Mathers, C, and Parkin, DM.GLOBOCAN 2008cancer incidence and mortality worldwide: IARC CancerBase No 10.International Agency for Research on Cancer,Lyon;2010http://globocan.iarc.fr. ((accessed April 19, 2013).)

[2]Siegel, R, DeSantis, C, Virgo, K et al.Cancer treatment and survivorship statistics, 2012.CA Cancer J Clin.2012;62:220241

[3] Center, MM, Jemal, A, Smith, RA, and Ward, E.Worldwide variations in colorectal cancer.CA Cancer J Clin.2009;59:366378

[4]Bosetti, C, Levi, F, Rosato, V et al.Recent trends in colorectal cancer mortality in Europe.Int J Cancer.2011;129:180191

[5]Guo, P, Huang, ZL, Yu, P, and Li, K.Trends in cancer mortality in China: an update.Ann Oncol.2012;23:27552762

[6]Brenner, H, Bouvier, AM, Foschi, R..., and the EUROCARE Working Group.Progress in colorectal cancer survival in Europe from the late 1980s to the early 21st century: the EUROCARE study.Int J Cancer.2012;131:16491658

[7]Sankaranarayanan, R, Swaminathan, R, Brenner, H et al.Cancer survival in Africa, Asia, and Central America: a population-based study.Lancet Oncol.2010;11:165173

[8]邓祯祥. 整合卵巢癌拷贝数变异和差异表达基因的生物信息学分析[D].广州:南方医科大学.2014年

以上是毕业论文开题文献,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。