首页 > 文章中心 > 生物统计的研究方向

生物统计的研究方向

前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇生物统计的研究方向范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。

生物统计的研究方向

生物统计的研究方向范文第1篇

关键词:运动人体科学;论文选题

中图分类号:G807.0 文献标识码:A 文章编号:1007―3612(2006)09―1231一04

本文对1982―2003年全国体育院校及部分重点大学体育院系、国家体育总局等30多个单位的运动人体科学专业硕士、博士生研究生论文选题进行了分类统计和比较分析,并对其选题方向和特点进行归纳总结,以期为今后运动人体科学学科研究生的论文选题提供参考。

1 研究对象与方法

1.1研究对象 本文共收集1982―2003年运动人体科学专业各研究方向的研究生论文505篇,其各专业的分布情况如下表:

1.2研究方法

1.2.1 文献资料法 本文搜集了研究生论文选题方面的文献并进行了分类整理,获得了相关资料和信息。

1.2.2数理统计法 对论文的题目、研究对象、研究方向、研究内容和特征等指标进行了初步统计,并对统计结果进行了数理分析。

2 结果与分析

2.1 人体运动科学专业论文分布情况 运动生理方向的研究生论文数量占运动人体科学专业研究生论文总数的46.34%(表1),这与以北京体育大学为代表的一批体育院校运动生理学科点开设较早、而其他学科点开设较晚有关,同时与80年代某些院校只设立运动生理专业硕士的现象也有一定的关系。数据显示:运动生物力学方向的论文数量较少,90年代后有所增加,这主要是由于运动生物力学为一门较为年轻的学科,在我国的起步较晚;而运动解剖学方向的论文数量总数也相对比较少,尤其是进入21世纪后的3年中运动解剖方向的研究生数量急剧减少,其原因主要在于各院系的招生培养结构所致,该学科属基础理论学科,且与运动训练相关性不大所致。

从图形及数量分析可以看出,各研究方向在年代分布上,尽管呈现出一些波动,但总体趋势是各研究方向的数量和总数都在逐渐增多。

统计结果显示,近年来运动生理学研究生的选题方向主要集中在骨骼肌生理、疲劳与恢复、机能评定和心血管等范围内,其数量占运动生理方向研究总数的55.98%,这与目前国内体育期刊上相关领域的研究方向与研究趋势基本相符。其原因是骨骼肌生理,运动性疲劳与恢复,运动员机能评定及心血管等方向与运动训练关系密切,这些研究可以解决运动训练中出现的实际问题。进入21世纪后,内分泌功能的调解、训练效果等与大众健康、全民健身关系密切相关的问题也将受到了重视,其研究生论文数量必然有所增加。

2.2各专业方向研究生论文选题方向分析

2.2.1运动生理专业

2.2.2运动生化专业

如表3所示,营养是运动生物化学方向研究的一个主要方面,其研究生论文数量约占总数的1/3。在运动训练中“没有恢复就没有训练”的新观点提出之后,人们开始逐渐着眼于营养学的相关研究,如何应用合理的营养手段来延缓运动性疲劳的产生,促进运动后恢复已成为体育科研领域中的热点问题。但这些论文的研究对象多采用动物实验,对人体的研究相对较少,而运动营养及合理的恢复段在运动员当中推广使用,还须更多的人体实验作为更直接的依据。随着国民经济的发展和体育健身在我国的开展,近年来针对各种健身锻炼项目的训练效果的研究数量也在逐渐增加,呈现了与运动生理方向相一致的变化趋势。

2.2.3运动解剖学

统计数据显示,儿童少年体质现状和生长发育规律及体育运动在人体塑造方面的作用是运动解剖学方向研究者们所关注的主要问题,其论文数量分别占该研究方向论文总数的37.14%和28.57%。涉及骨骼肌的形态结构与功能的基础性研究也占有一定的比例,而其它方向的论文数量比例均相对较少,呈现出明显的“选题分布极不均衡”的特点,这一现象说明运动解剖学知识领域广泛,可供研究的问题相对比较多,而经过几十年的发展,运动解剖学已经形成了较为固定的研究领域,这也是一个学科发展基本成型的表现。

2.2.4运动医学

统计数据显示,运动医学方向研究生的选题方向主要集中于心血管生理、训练效果、骨骼肌生理及运动损伤等方向,各个方向的科研讨论数量分布均衡,占其方向的百分比均在15%左右,且这些研究相对集中,与运动训练实践结合比较紧密,体现了科学研究服务于训练实践的基本指导思想,和运动医学实用性较强的学科特点。

2.2.5运动生物力学

统计数据显示,运动生物力学方向的研究热点集中在对运动项目的某些技术环节的动作分析上,其研究主要是利用运动生物力学的手段辅以现代化技术手段展开探索研究,从而得到一些敏感指标、数据,并采用计算机评价系统进行分析、评价。其中涉及动作技术分析的占42.86%,而涉及计算机评价系统的研究呈现逐渐增长的趋势,达到生物力学研究生论文总数的23.81%,体现了运动生物力学与计算机科学的联系日趋紧密。随着科学的发展运动生物力与数学、物理、计算机、医学等学科的交叉将逐渐增多。

2.2.6 各专业方向选题特点的分析 从表2~6的数据统计结果显示,各方向的选题方向一方面呈现了各自专业的学科特点,同时各学科之间互相关联,存在一些共同点。

从各自专业方向选题特点来看,运动生理方向选题中骨骼肌生理及疲劳与恢复的内容较多,尤其是在90年代前后,对肌纤维类型、肌纤维组成比例的研究很多,采用无损伤方法测定肌纤维类型,对延迟性肌肉酸痛以及骨骼肌疲劳后超微结构改变的研究,都是这一领域的研究热点。

运动生化方向对运动员营养补充问题以及运动后恢复手段的研究得到越来越多的注视。“没有恢复就没有训练”这一新观点提出之后,营养及其他恢复手段成为竞技体育中的热门问题。

运动解剖学方向论文选题明显集中在“儿童少年体质现状和生长发育规律的研究”、“体育运动对人体器官组织形态结构影响的研究”和“骨骼肌形态结构和功能的研究”这3个方向,占论文总数的80%。

运动医学的选题则集中在创伤、心血管、训练效果及骨骼及生理四方面,而且分布比较均衡,各占该方向论文选题的13.04%、17.39%、15.22%和13.04%。

运动生物力学是相对较为独立的学科,其选题集中在两个方面:动作技术分析(42.86%),其次是计算机评价系统的研究(23.8l%);除此之外人体组织力学、动力学及身体素质等方面的论文选题也逐渐受到一定程度的关注。

2.3各专业方向研究生论文的研究对象

统计数据显示,运动人体科学专业的研究对象中动物实验占到总数的41.05%。运动员只占到19.26%左右,位居第

三位的是体院学生,占12.26%。近年来,动物实验的比重越来越大,而人体实验在逐渐减少。

从科学研究的实际应用价值上看,人体实验的科学研究通常具有更直接的实用价值。但是,由于人体实验时,实验条件不一,且实验对象在实验期间难以控制,作为受试对象的人本身个体差异较大,因此在实际实施过程中会造成很大的困难。动物实验的优点是样本个体差异小,条件容易控制,测试结果更为准确,特别适合做一些机制性的研究。其缺点是动物与人的亲缘关系太远,有时候反映在动物身上的变化,未必可以在人体上得到重现。而且,动物采用的运动模型较为单一。从目前来看,常用的动物运动模式为大鼠(或小鼠)游泳,以及在动物跑台。且不说这些运动模型的控制是否严格,从这些运动方式上看,与人体的运动毕竟有一定的差异。而且疲劳点如何确定的问题,一直是动物实验论文中存在争议的问题。

在实际操作中,如何将人体实验与动物实验的优势结合起来,一直是研究生论文需要重点考虑的问题。好的选题不仅在于题目本身,实验设计也是论文成败的关键。

2.4各专业方向研究生采用的研究手段

2.4.1运动生理专业

2.4.2运动生化专业

2.4.4运动医学专业

数据显示,运动生理、生化、解剖和运动医学方向研究生论文中使用的各种研究手段中,运动生化指标的测定占相当大的数量和比例。尤其与运动实践结合比较密切的论文多采用生化指标对受试者进行评定,观察受试者身体机能的变化。如:血乳酸一直是科学训练所关注的主要问题。另外,血常规、血尿素指标以及以血清酶的变化都是运动训练中经常涉及的问题。另外,在一些机制性的研究中,如运动性低血睾,运动性闭经或月经紊乱等问题,都需要对激素及激素受体辅助生化手段进行定性分析。近些年来,随着基因分析手段的日益更新、先进,实用性的基因分析手段逐渐应用到了体育科学研究中来,例如对骨骼肌a―actin基因表达的研究,对β-肾上腺素受体基因表达的研究,对衰老过程中线粒体DNA缺失的研究等等,都是现代基因手段与运动实际相结合的有益尝试。

在研究手段的选取上:运动生理学使用较多的是生化指际、生物电技术和常规生理指标,共占其研究总数的74.99%,近几年来,借助生化指标检测的研究数量逐渐升高。运动生化方向则是生化指标占绝对统治地位,达到总数的85.19%,充分体现了本学科的特点。运动解剖学则较多地应用身体素质指标、组化电镜、生物电技术及常规生理指标等,所采用研究手段相对较多,且分布均匀,即运动解剖学的研究手段呈现多元化。运动医学方向中应用较多是生化指标、常规生理指标和组化电镜及生物电技术,占该方向研究手段总数的89.36%,体现了运动医学监测过程中需要借助生理、生化手段的特点。各方向的研究手段呈现出互不相同特点,归结原因在于不同专业研究的侧重点不同所致。

动作技术分析系统是运动生物力学专业研究中最常用的手段,占生物力学各研究手段总数的42.22%,它是运动生物力学为运动训练直接服务的最常用手段,在近几年随着计算机技术和数码拍摄技术的发展取得了很大的进展。随着计算机技术的不断发展,计算机也逐渐进入体育科学研究领域,其主要运用在计算机分析、评价系统中,这些先进、准确手段的引入对运动训练和科学研究产生了巨大的推动作用。

2.4.6 除运动生物力学外所有专业不同年代研究手段的对比

表13显示,80年代采用较多的是生物电技术、常规生理、生化指标,各占总数的28.87%、25.77%、25.77%,他们之间的分布相对均衡。进入90年代后,随着研究的进一步深入,一些简单手段,如生物电技术和常规生理指标的应用比例逐渐减少,而生化指标等反应受试者机体机理的研究手段所占比例增大,达到总数的52.30%,体现了各学科研究的精确、精细化和定量分析的逐渐增多。随着科学技术的发展,一些前沿科技手段,如基因技术开始在运动人体科学领域中应用。本文所统计的只是2001―2003年的研究生论文,样本量相对较少,但其变化趋势基本和90年代相同,这些变化趋势反映了体育科学研究的不断深入以及研究手段的不断发展,同时也反映了运动人体科学专业学科水平的提高。

3 结 论

生物统计的研究方向范文第2篇

攻克痛经难题,该不该庆祝?本是一个不需要讨论的话题,因为饱受痛经折磨的女性不在少数,科研的真正目的就是“让生活更美好”,惠及百姓生活。但意外的是,居然有对这种着眼解决生活难题的科研取向加以讽刺。偶然中有必然,这种社会态度的出现及获得追捧,不仅反映出公众对科研价值认识的误区,也在一定程度上反映了现实的科研取向扭曲。

近年来,我国对科研成果的评价出现了一种量化的趋势,要看拿到多少国家级、省部级的课题立项,获得了多少科研经费支持,发表了多少科研论文。于是,大量高端科研人才不太关注现实的生活难题了,纷纷将目光投向“高精尖”领域,甚至以关注痛经这样婆婆妈妈的生活问题为耻。造成的结果,一方面科研看似繁荣,每年发表的论文总数已稳居世界前5位;但另一方面,每年国家统计的数万项科研“成果”中,90%以上未产生实际价值。

对我国科研取向的问题,中国工程院院长周济在2006年担任教育部部长时曾指出:“科研还没有深入到实践中去,现实中有些科研论文上不着天,下不着地,头重脚轻根底浅”;他强调“要把科学研究和创新精神投入到实践活动中去,绝大部分科技工作都要在解决实际需要的过程中攀登世界高峰”。从对“庆祝攻克痛经难题”的嘲讽中,我们感到,不仅一些科研工作者的科研态度还没有根本转变,而且公众对科研的预期也依然存在“高精尖”的偏执,这是非常令人担忧的。

痛经,虽不是“世界性的难题”,但却是一个“世界性的生殖健康问题”。医学上认为引起痛经的因素比较多,还没有一个直接的针对性疗法。因此,研究痛经依然是一项十分有价值的科研选题。

实际上,笔者之所以认为“攻克痛经难题”值得大肆庆祝,主要有这样几个理由:一是郭博士因为研究所的小师妹饱受痛经折磨而弯下腰来解决现实问题的科研取向是值得肯定与提倡的;二是郭博士在研究中医药方向的同事指导下,以自己“生物电”的研究方向为思维出发点,发明了“痛经膏”,更加突出了现代科研协同创新的必要;三是郭博士的研究不是为了申请课题,获得科研经费,不是为了,而是为了解决现实问题,庆祝本身就具有对功利化科研取向的纠正作用。

生活是可以更美的,但如果科研都不关心我们的吃喝拉撒了,我们的生活还会更美吗?一个地沟油的检测技术,就已经成为困扰我们生活的现实难题,对“庆祝攻克痛经难题”都要加以嘲讽,也许我们就只有继续吃地沟油的命运了。科研要“顶天立地”,对“顶天”自然应该给予奖励关注;但对“立地”的科研,长期以来,我们是否少了一些期待、支持和鼓励呢?

生物统计的研究方向范文第3篇

关键词:山药(Dioscorea opposite Thunb.);专利;现状

中图分类号:S632.1 文献标识码:A 文章编号:0439-8114(2016)11-2968-03

DOI:10.14088/ki.issn0439-8114.2016.11.064

山药(Dioscorea opposite Thunb.)是薯蓣科薯蓣属一年生或多年生缠绕性藤本植物,在中国的东北、华北、华中、东南、西南等地区普遍栽培,并形成了许多地方品种[1]。山药是卫生部认定的药食兼用植物,具有极高的营养价值与医疗保健作用。传统中医认为山药具有补益强壮,补脾养胃,生津益肺,补肾涩精,治疗消渴功效。现代研究发现,山药含有多糖、尿囊素、皂甙、糖蛋白等活性成分[2]。

专利的拥有量可以从侧面反映一个国家或地区的创新能力、科技水平和市场化程度,是衡量科技产出和知识创新的一项重要指标[3]。本研究统计了2005―2014年中国专利数据库关于山药的专利申请,包括专利数目、专利类型、专利申请地域、主要竞争者情况等指标。通过分析这些指标的变化趋势,可以明确今后山药的研究方向,从而进一步推动山药产业的发展。

1 数据来源

利用湖北省农业科学院的IP登陆湖北省农业科学院数字图书馆,进入中国知网中国专利数据库,检索项选择“专利名称”,专利名称设置为“山药”,公开日选择从2005年1月1日至2014年12月31日。

2 结果与分析

2.1 总体趋势分析

2005―2014年,国内关于山药专利数量共计940项。从图1可知,随着年份增加,专利数量呈现不断上升趋势,其中2010―2014年呈现急剧上升趋势,这说明山药研究的整体水平有了显著提高。这与国家对农业科研的投入力度明显加大有关,2010年中国共投入R&D经费7 062.6亿元,比2009年增加1 260.5亿元,增长21.7%,而与2003年的 1 539.6亿元相比增加5 523.0亿元,增长358.7%[4]。

2.2 专利类型分析

在被统计的940项专利中,发明专利有741项,占统计数据的78.83%;实用新型专利80项,占统计数据的8.51%;外观设计专利119项,占统计数据的12.66%。专利类型统计数据表明,目前中国山药专利以发明专利为主。发明专利的原创程度和技术含量要明显高于实用新型和外观设计专利,是支撑经济发展方式转变的核心创新成果,故而在三大专利类型中最为重要[5,6]。

2.3 专利申请地域分布分析

中国34个省(市、自治区和特别行政区)中有30个地域申请山药专利。表1显示,在该地域的申请人中,申请量最多的是河南省,共计189项;其次是江苏省,申请相关专利130项;排在第三位的是山东省,申请相关专利126项;广东省申请专利112项,排在第四位。此外,安徽省、广西省、天津市、浙江省、湖北省和辽宁省,申请专利位于第5位到第10位。前10位申请的专利数占总数的83.30%,而山药的种植主产区也集中在这一区域,可见山药专利申请主要集中在山药的主产区。

2.4 专利品种类型分析

由表2可知,在被统计的940项专利中,怀山药有61项,占统计数据的6.49%;紫山药22项,占统计数据的2.34%;铁棍山药有21项,占统计数据的2.23%;淮山药有13项,占统计数据的1.38%;蕲山药有4项,占统计数据的0.43%。怀山药、铁棍山药、淮山药、蕲山药都是中国道地药材。道地药材是中国传统药物学的一大特色,它特指那些具有中国特色、传统公认、久经中医临床验证、来源于特定产区的名优正品药材[7]。中药道地药材对中医治疗疗效至关重要,对道地药材的研究一直是科学研究的热点。

紫山药的专利数量相对较多,主要原因是随着经济的发展和人民生活水平的提高,人们越来越重视营养和健康。紫山药含有花色苷类化合物,花色苷作为一类广泛存在于高等植物中的天然水溶性色素,安全无毒,并在抗氧化、抗炎症、抗突变、抗肿瘤、改善视力、预防和治疗心脑血管疾病、神经系统疾病等方面具有良好的作用,使其成为研究的热点[8]。

2.5 山药领域主要竞争者情况分析

从表3中可以看出,申请量最多的个人是陈慧婷,有53项专利,占前11名27.46%。申请量最多的企业是河南铁大哥农业开发有限公司,有22项专利,占前11名的11.40%。申请量最多的科研院所是徐州市农业科学院,有11项专利,占前11名的5.70%。申请量最多的大专院校是河南师范大学,有8项专利,占前11名的4.15%。个人的专利申请量占有较大比例,企业、大专院校和科研院所的专利相对较少,未形成明显优势。

3 讨论与建议

3.1 专利申请数量变化趋势

山药专利申请数量呈现较快的增长态势,说明山药产业具有广阔的市场发展前景,众多企业、个人和研究机构进入了该领域。余昕等[9]通过分析科研投入效率发现,科研资金投入与科研人数的增加对科研能力的提高有显著影响。郑兴东等[10]在研究高等医学院校科研投入产出时发现,申请及授权专利数量与研究生数量及科研经费有密切关系。山药专利数量的增加不仅需要增加科研经费,同时需要引进更多的科研人员。

3.2 山药专利申请热点

随着生活水平的提高和健康认识的加深,人们不仅仅满足于吃饱,更偏向于营养价值和保健功能的追求。道地药材和紫色山药由于比普通山药具有更好的营养价值和保健作用,受到了广大消费者的推崇。在被统计的940项专利中,怀山药、铁棍山药、淮山药、蕲山药的研究占有较大的比例,中国道地药材,是经过中医长期临床优选出来的,在特定区域,通过特定生产过程所产的,较其他地区的同种药材品质佳、疗效好,具有较高知名度的药材[11]。紫山药的专利数量相对较多,主要是由于人们保健意识的提高,食用紫色农产品成为一种时尚,其市场需求量迅速增长,种植紫山药前景较好,经济效益也很可观[12,13]。

3.3 专利申请的主要竞争者

山药的专利申请中个人专利申请量占有较大比例,企业、大专院校和科研院所的专利相对较少,未形成明显优势。主要原因是中国一直缺乏对研究资源的有效管理,形成了“重论文、轻专利”的科研成果评价标准。研究成果因快速以论文形式公开而使其新颖性丧失无法申请专利,造成科研资源极大的浪费[14]。

3.4 政策及建议

1)加大科技投入,促进山药领域技术创新。中国近十年在山药领域的基础研究进步虽然非常明显,但是基础研究明显跟不上山药产业发展的脚步。科研投入是科技创新的物质基础,是科技持续发展的重要前提和根本保障。虽然近年来R&D经费增长较快,但与发达国家相比差距仍然较大,要改变目前科技创新能力不足的现状,有必要继续加大对科技人员的科研经费的投入[15]。

2)科研人员应该转变观念,强化专利保护意识。当前农业科研人员的科研工作中,在取的一项科技成果后,往往不是先申请专利,而是急于、申请成果鉴定、申报奖励等,研究成果大多以论文的形式发表,丧失了新颖性,使成果不能得到法律的保护[16]。

3)完善专利奖励机制,充分发挥科技奖励在引导科技发展方向和表彰科技人才的重要作用。科技奖励与科研人员的晋升和待遇有着密切的关系,对科技人员具有重要的导向作用[17]。只有建立一个荣誉、关怀与物质奖励并重的奖励机制,才能激发科研人员申报专利的积极性,最大限度地促进专利申报的发展[18]。

参考文献:

[1] 蔡月琴,陆銮眉,胡林佳,等.山药组培快繁条件优化的研究[J].福建热作科技,2015,40(2):14-17.

[2] 王洪新,王远辉.山药多糖研究进展[J].食品与生物技术学报,2011,30(3):321-327.

[3] 池敏青,曾玉荣,刘健宏.基于专利信息分析的农业科研单位科技创新能力研究――以福建省农业科学院为例[J].福建农业学报,2014,29(12):1251-1255.

[4] 王贵春,王晓芳,田宇曦,等.《湖北农业科学》1998-2011年载文分析[J].湖北农业科学,2012,51(23):5548-5549.

[5] 刘兰娜.我国水稻产业专利情报计量分析与趋势研究[J].现代情报,2013,33(3):93-97.

[6] 刘思明,侯 鹏,赵彦云.知识产权保护与中国工业创新能力――来自省级大中型工业企业面板数据的实证研究[J].数量经济技术经济研究,2015,3:40-57.

[7] 张重义,林文雄,林瑞余.中国道地药材研究现状与展望[J].亚热带农业研究,2007,3(4):258-262.

[8] 倪勤学,高前欣,霍艳荣,等.紫山药色素的提取工艺及抗氧化性能研究[J].天然产物研究与开发,2012,24(2):229-233.

[9] 余 昕,王 东,韩 楠,等.发达国家科研投入效率初探――基于16个OECD国家纵列数据的统计学分析[J].科技进步与对策,2007,24(8):129-131.

[10] 郑兴东,刘 源,陆 伟.高等医学院校科研投入产出分析[J].医院管理杂志,2007,14(6):459-461.

[11] 韩邦兴,彭华胜,黄璐琦.中国道地药材研究进展[J].自然杂志,2011,33(5):281-285.

[12] 汪亚萍,吴东根,刘文辉,等.紫山药的高产栽培技术[J].中国农业信息,2011(7):33-34.

[13] 张海燕,李爱贤,张立明,等.山东省紫山药高产栽培技术[J].农业科技通讯,2015(1):139-140.

[14] 徐 凯,高山行.中国高等院校科研投入-产出研究[J].研究与发展管理,2008,20(2):97-101.

[15] 吴 杨,何光荣,何晋秋.高校科研投入与产出的相关性分析:1991-2008[J].清华大学教育研究,2011,32(4):104-112.

[16] 张成亮,吴 爽,赵 杨,等.黑龙江省农业科学院专利保护现状及发展建议[J].黑龙江农业科学,2015(4):164-165.

生物统计的研究方向范文第4篇

【 关键词 】 恶意代码;函数调用图;UPGMA法;系统发生树构建

A Method Constructing the Phylogenetic Tree of Malware Based on UPGMA

Jiang Zhi-xiong Wang Bao-sheng Sun Zhi-feng Tang Yong Tian Shuo-wei

(Department of Computer Science,National University of Defense Technology HunanChangsha 410073)

【 Abstract 】 Using for reference on the methods that construct the phylogenetic tree among genes or speces in bioinformatics, this paper presents a method that constructs the phylogenetic tree of malware based on function-call graphs of malware and UPGMA method, and do some experiments using value of the similarity distance of marware’s function-call graphs (called SDMFG).This method provide a strong support and reference for analysis of the homology and evolution characteristics of malware and malware detection and prevention.

【 Keywords 】 malware; function-call graphs ;upgma method; phylogenetic tree

1 引言

恶意代码分析是检测和防范恶意代码的重要基础。随着恶意代码开发的各类源代码、技术文档和辅助工具的日益丰富,恶意代码的产生更为简单和模块化,变种和演化更为多样和快速,数量呈加速增长的趋势,每天捕获成千上万个样本已经是很平常的事了。在实际中,除了分析恶意代码的各种外部表现,人们还关心恶意代码在同源和演化方面的内在特性,包括恶意代码从何而来、如何发展变化以及家族之间和变种之间的关系等等。

本文将通过IDA工具和插件提取每个恶意样本的函数调用图,计算出每两个恶意代码函数调用图之间的相似性距离,构造一个距离矩阵,利用生物信息学中的UPGMA法建立这组恶意代码样本的系统发生树,从而体现恶意代码的同源性关系,对恶意代码样本的演化分析和聚类分析提供帮助。

2 函数调用图的相似性距离

文献[1]提出了一种函数调用图的相似性度量――恶意代码函数调用图的相似性距离(SDMFG, The Similar Distance of Malware’s Function-call Graphs)。此度量方法主要是借鉴编辑距离的思想,把两个恶意代码函数调用图的相似性看做由一个图转化为另一个图的最小成本,用顶点间的匹配操作代替图的编辑操作、匹配路径代替编辑路径、匹配成本代替编辑成本,综合函数指令序列的相似性以及函数的调用关系的相似性计算顶点的相似性,并把1与顶点的相似性之差作为顶点间匹配的成本,最后通过计算完美匹配路径的最小匹配成本来度量两个恶意代码的函数调用图的相似性。

3 UPGMA法构建系统发生树

3.1 系统发生树

系统发生树,也称进化树,是三个或者更多基因或者生物体之间进化关系的典型图示。它是由一系列节点和分支组成的,其中每个节点代表一个基因或者生物体。分支末端的节点(外部节点,也叫叶节点)对应一个基因或者生物体。内部节点代表一个推断出的共同祖先,它在过去的某个时候分歧出两个独立的分支。这样的树浓缩了千言万语,不仅表示了数据集之间的关系,还体现了它们的分歧时间和它们共同祖先的特征。

系统发生树结构的基本信息在计算机程序中常常用Newick格式表示。例如用Newick格式来表示图1中的树,可写成{[(A,B),(C,D)],E}。

3.2 UPGMA法

在生物信息学中,通常都是用物种的系统发生树(即进化树)来表示物种之间的进化关系的,系统发生树的构建方法主要有两种:一种是基于距离数据构建,一种是基于特征数据构建。由于本文利用的是恶意代码函数调用图的相似性距离数据,所以主要借鉴生物信息学中基于距离的系统发生分析方法。

利用UPGMA构建进化树时,首先用n个叶节点表示n个分类单元(序列),每个分类单元自成一类,然后从距离矩阵中选择距离最小的一对分类单元聚为一类,形成一个新的分类群,并计算这个新的分类群与其他分类单元之间的距离,得到一个新的距离矩阵,重复上述过程,最终会得到一个以所有分类单元为叶节点的系统进化树。

UPGMA法是树重建方法中比较简单的一种。该方法是基于统计的,像所有基于距离的方法一样,要求数据能够精简为所有被研究的物种两两之间遗传距离的度量。一般来说,UPGMA方法需要建立一个距离矩阵,例如为4个物种A、B、C和D建立的矩阵,假设其两两距离如表1所示。

在这个矩阵中, dAB表示物种A和B之间的距离,dAC表示物种A和C之间的距离,以此类推。 非加权组平均法的基本思想是:首先将两个距离最近的物种合成一个复合物种组。这里,假设距离矩阵中最小值是dAB,所有物种A和B首先合成一组(AB)。第一次聚类后,要更新距离矩阵,计算新组(AB)与物种C和D之间的距离:d(AB)C=(1/2)(dAC+dBC),d(AB)D=(1/2)(dAD+dBD)。然后,将新的距离矩阵中距离最小的两个物种再次合成一个复合物种组。如此反复,直到所有物种都聚为一类。如果在树中用分支长度表示物种之间的进化距离,则分支点位于原来两个物种之间距离的一半处(例如在第一次聚类中,dAB/2分支点所在位置)。

确定进化分支图中每一条分支的相对长度,只要利用距离矩阵中的信息进行简单计算。如果假设所有家系的进化速率不变,那么内部节点将置于与分叉树上相对应的两个物种距离相等的地方。例如,物种A和B之间的距离(dAB)是10,那么连接这两个物种和它们共同祖先的一对分支均应为dAB/2,即5.0。这个简单的估计分支长度的方法使得UPGMA成为能构造有根系统发生树的少数几种方法之一。

3.3 构建系统发生树

这里简要介绍下UPGMA法构建恶意代码样本系统发生树的具体算法。

算法:

输入:一组n个恶意代码样本及其任意两个之间的函数调用图的相似性距离d;

输出:这组恶意代码样本系统发生树T。

有几个步骤。

(1)构建n个恶意代码样本的距离矩阵C1,每列都对应一个恶意代码样本,从第一个恶意代码样本到第n-1个样本,每行也都对应一个恶意代码样本,从第二个样本到第n个样本;矩阵元素的值就是所对应的两个恶意代码样本之间的函数调用图的相似性距离d;构建完矩阵之后进入步骤(2)。

(2)找到距离矩阵C1的值最小(即相似性距离最小)的元素,将它对应的两个恶意代码样本A和B合成一个复合样本组(AB),并计算连接这两个样本和它们共同祖先的一对分支的长度dAB/2,进入步骤(3)。

(3)更新距离矩阵。如果距离矩阵C1中有A列和B列且只有A或者B行,则将距离矩阵C1的A列和B列合成一列(AB)并将B行(或者A行)去掉,其余不变,得到了一个新的(n-2) (n-2)的距离矩阵C2;如果距离矩阵C1中有A行和B行且只有A或者B列,方法类似;如果距离矩阵C1中有A列和B列且有A行和B行,则将距离矩阵C1的A列和B列合成一列(AB),将距离矩阵C1的A行和B行合成一行(AB),其余不变,得到了一个新的距离矩阵C2。进入步骤(4)。

(4)计算距离矩阵C2。首先分别计算距离矩阵C2中与复合样本组(AB)相关的位置的矩阵元素的值,计算方法如下:新组(AB)与任一样本C的距离=(样本A与样本C的距离+样本B与样本C的距离)/2,即d(AB)C=(1/2)(dAC+dBC);这样计算新组(AB)与剩下的所有样本之间的距离,并填入距离矩阵C2相应的位置;与复合样本组(AB)无关的矩阵位置,它们的值不变;进入步骤(5)。

(5)重复步骤(2),即在距离矩阵C2中找到值最小的元素,将其对应的两个恶意代码样本再次合成一个复合样本组;重复步骤(3)(4),直到这n个恶意代码样本都聚为一类。

(6)根据前面聚类过程,重建这n个恶意代码样本的系统发生树T。

下面用一个实例来说明UPGMA算法构建系统发生树的过程。对一组5个恶意代码样本(A、B、C、D和E),且它们之间的两两函数调用图相似性距离分别如表2所示,易知,样本D和E的相似性距离是距离矩阵C1中最小的元素值(dDE=1.9),所以样本D和E聚到一组,并合成一个复合样本组(DE),连接这两个样本和它们共同祖先的一对分支的长度dDE /2=0.95。

因为距离矩阵C1中有D行和E行且只有D列,去掉D列,合并D行E行,得到了一个3×3的距离矩阵C2。然后计算新的距离矩阵C2,dA(DE) = (1/2)(dAD+ dAE) = 4.9,dB(DE)= (1/2)(dBD+ dBE)=3.9,dC(DE)= (1/2)(dCD+ dCE) = 3.1,样本D和E之外的3个样本中任何两个样本的相似性距离不变,距离矩阵C2如表3所示。

可见,样本A和B的相似性距离是距离矩阵C2中最小的元素值(dAB=2.8),所以样本A和B聚到一组,并合成一个复合样本组(AB),连接这两个样本和它们共同祖先的一对分支的长度dAB /2=1.4。方法同上,计算新的距离矩阵C3,d(AB)C= (1/2)(dAC+ dBC) = 4.0,d(AB)(DE)= (1/2)(dA(DE) + dB(DE)) =4.4,其余元素值继承距离矩阵C2中对应元素的值。距离矩阵C3如表4所示。

样本C和复合样本组(DE)的相似性距离是距离矩阵C3中最小的元素值(dC(DE)=3.1),所以样本C和复合样本组(DE)聚到一组,并合成一个复合样本组(C(DE)),连接这两个样本和它们共同祖先的一对分支的长度dC(DE)/2=1.55。去掉C列,并用C行和DE行合并成(C(DE))行,得到了一个1×1的距离矩阵C4。然后计算新的距离矩阵C4,d(AB)(C(DE)) = (1/2)(d(AB)C+ d(AB)(DE)) = 4.2,距离矩阵C4如表5所示。

复合样本组(AB)和复合样本组(C(DE))的相似性距离是距离矩阵C4中最小的元素值(d(AB)(C(DE)) =4.2),所以复合样本组(AB)和复合样本组(C(DE))聚到一组,并合成一个复合样本组((AB)(C(DE))),连接这两个样本和它们共同祖先的一对分支的长度d(AB)(C(DE)) /2=2.1。

4 实验结果与分析

实验中的数据集来自于Kaspersky的恶意代码样本。这些恶意代码样本包括Trojan、virus、worm和backdoor等种类。每个恶意代码样文件的名字都是由恶意代码名称以及样本哈希值构成。所有工作都是在Windows XP系统上,用C语言编写并在VC6.0上实现的。

我们选取了7个Trojan.Win32样本、4个Trojan-Dropper.Win32.VB样本、3个Virus.Win32.Virut样本和2个Trojan-Downloader.Win32.CodecPack样本进行函数调用图的提取,并计算了他们两两之间的SDMFG值。根据这些值利用UPGMA法进行分析,得到的系统发生树如图2所示。

图中右边是各个恶意代码样本的名称,左边是用线段表示的恶意代码样本间的同源关系,其中用直线连接恶意代码样本或者由恶意代码样本构成的复合样本组及它们的父节点,线段的长度体现了恶意代码样本或者由恶意代码样本构成的复合样本组到它们父节点的分支长度。其长度由下面的标度尺统一度量。

容易看出,同一恶意代码的不同样本基本分在一类里,而不同恶意代码的样本则没有分在一起,同一恶意代码的不同样本之间的分支长度很小,而不同恶意代码的样本之间的分支长度较大,所以同源分析结果比较好,基本体现了实际情况。

实验验证了基于恶意代码的函数调用图和UPGMA法对恶意代码的同源关系进行分析的方法具有技术可行性,表明该方法既能正确反映同类恶意代码样本之间的演化关系,体现了代码的演化方向,也能区分不同类恶意代码样本的家族属性。

5 结束语

本文利用生物信息学里的UPGMA法为恶意代码样本构建了系统发生树,比较深入和准确地刻画了样本之间的相似性,形象地描述了样本之间的演化关系。此方法能够为恶意代码样本的自动聚类分析以及样本的演化发展和同源性分析提供有效的参考和支持。

参考文献

[1] 刘星,唐勇,黄遵国,李琰,官强.恶意代码的函数调用图相似性分析[J].计算机工程与科学,2013.

[2] David W主编,钟扬,王莉,张亮,主译.生物信息学.高等教育出版社,2003.

[3] Dan E.Krane& Michael L.Raymer.生物信息学概论[M].北京:清华大学出版社,2004.

[4] Simmons MP,Müller KF,Norton AP. Alignment of and phylogenetic inference from random sequences: The susceptibility of alternative alignment methods to creating artifactual resolution and support. Molecular Phylogenetics and Evolution,2010,57(3):1004-1016.

[5] Liu L,Yu L,Kubatko L,Pearl DK,Edwards SV. Coalescent methods for estimating phylogenetic trees. Molecular Phylogenetics and Evolution,2009,53: 320-328.

[6] 朱雯.基于距离矩阵的进化树构建方法研究[D].长沙:湖南大学,2010.

[7] 方志鹤.恶意代码分类的研究与实现[D].国防科学技术大学, 2011.

[8] 左黎明,徐保根,汤鹏志,刘二根.未知恶意代码族群归属决策研究[J].微电子学与计算机, 2012.

[9] L.A.Goldberg,P.W.Goldberg,C.A.Phillips,et al.Constructing computer virus phylogenies[J]. Journal of Algorithms,1998,26(1):188-208.

[10] M.Hayes,A.Walenstein,A.Lakhotia.Evolution of malware phylogeny modeling systems using automated variant generation[J]. Journal in Computer Virology, 2008:1-9.

[11] Xin Hu,Sandeep Bhatkar,Kent Griffin,Kang G. Shin. MutantX-S: scalable malware clustering based on static features. 2013 USENIX conference on Annual Technical Conference,2013.

基金项目:

国家自然科学基金,项目编号61472437。

作者简介:

江志雄(1985-),男,云南昆明人,国防科学技术大学硕士在读;主要研究方向和关注领域:网络与信息安全。

王宝生(1970-),男,河北沧州人,国防科学技术大学计算机学院研究员,博士生导师;主要研究方向和关注领域:网络与信息安全。

孙志峰(1978-),男,河北冀州人,国防科学技术大学硕士在读;主要研究方向和关注领域:网络安全。

生物统计的研究方向范文第5篇

1现状分析

1.1学生基础参差不齐目前,我国的高等教育已从精英教育转化为大众教育,越来越多的高中生进入高校学习,生源差异较大,同时由于高中教育还存在地区差异,从而使得进入高等教育的学生的基础参差不齐.因而一味沿用以前的教学大纲、教学方法就显得不合时宜.而且,现在高校中的某些专业在招生时是文理兼收的,但学生的数学学习内容是不同的,如江苏省,数学中的排列、组合、二项展开等知识是文科生不需要掌握的,但这些在学习“概率论与数理统计”课程时却是必须的.在进入高校后,对不同专业及文理兼收专业的学生,在教授“概率论与数理统计”课程时,不加区分地使用相同的教学大纲,讲授相同的教学内容,就显得很不妥.

1.2教材内容安排有缺陷关于这一点,浙江大学的林正炎教授早就提出了[2].从目前全国高校的“概率论与数理统计”课程的教材来看,大多数教材都是概率论占大部分,约60%~70%,剩下为数理统计部分.这与“概率论与数理统计”课程是一门解决实际问题的应用性课程不相符合.很多学生学了该课程以后,仍不具备处理实际问题的能力,部分原因就在于现行教材重理论轻实际.另外,从现有教材的习题来看,过于偏差理论,缺乏实际环境.编者为了题目的简洁,而将原有环境进行了抽象化、理论化,使学生失去了对概率统计问题及思想背景的了解,从而影响了他们解决实际问题的能力.

1.3课时安排不合理由于“概率论与数理统计”是一门公共课,很多专业在编制培养方案时为增加专业课的学时数而有意压缩该课程的学时数,以致极大地影响了教学效果.同时,由于教材重概率轻统计,也影响了教师对概率与统计教学时数的安排,概率部分占去了太多的时间,统计部分匆匆而过,影响了统计方法、思维在学生处理实际问题及专业中的应用.

1.4教学手段落后在教授“概率论与数理统计”课程时,很多教师还是习惯采用“粉笔+黑板”的教学手段,在现代教育背景中,这不符合现代学生的学习心理,影响学生的学习兴趣,也影响了授课效率.

1.5考核方式单一很多学校采用平时加期末考试的考核方式,只是两者所占比例有所区别而已.这样的考核方式,也导致了教学中以概率为主,偏重理论,课程的应用性体现不明显,学生解决实际问题的能力无从显现.

2改革措施

2.1分层次教学应根据学生的不同基础、不同专业、高中阶段文理科选修的区别,在教学中实行分层次教学.根据学生的具体差异,制定不同的课程教学大纲、教学进度,整合教学内容,以切实提高教学效率.

2.2编制合适教材合适的教材应以“数理统计”为主线,概率论的知识可在其中需要的部分适当加入,并且难度要适中,不宜太深,否则又变成现有教材调换各章内容而已.编写教材时,在重视内容的同时,也要同样重视习题编制,避免抽象化、理论化,在习题中提供实际环境,使学生在解题过程中,培养解决实际问题的能力.

2.3合理安排课时合理安排课时既是指课时数的安排,同时也是指在规定的课时数内的教学内容的安排.首先应从各个学校各个专业培养方案的安排出发,重视“概率论与数理统计”课程的基础性、应用性特点,各专业在编制培养方案时给足学时数.建议至少安排64课时.其次,在总课时有限的情况下,教师要合理安排概率与统计的教学时数,在内容安排上,纠正现行教材重概率轻统计的问题.概率部分不能占用太多,要多介绍一些统计思想,处理实际问题的统计方法,这样更有利于学生的实际应用.但这种中间有一个矛盾:从以往考研数学大纲来看,对“概率论与数理统计”的要求还是以概率论为主的,但对大部分学生来说,学习该课程是为了以后在专业中的应用,因此,在教学中,教师还是需要注意概率与统计两部分内容课时的合理安排.对于因为将来准备考研而对这门课程有特殊需要的学生,可以以其他形式满足他们的需求,如选修课、考研辅导班等等,这样学习会更有针对性.

2.4改变教学手段教学手段要不断更新,可将幻灯、投影、电脑等适当引进课堂,如借助电脑演示随机数的生成、二维正态分布参数改变后图形的变化、二项分布的泊松近似等等[3].这样的改变不光是为了激发学生学习的兴趣,更要让学生学会利用计算机来处理一些实际问题.随着科技的发展,“数理统计”中所要处理的问题及方法已经形成了很多统计软件,如SPSS、SAS等等.这些软件可以很好地处理“数理统计”的参数估计、假设检验、回归分析等问题.任课教师应与时俱进,不但要有概率论知识的素养,熟悉数理统计中的基本理论和方法,还要掌握若干统计处理软件.

2.5激发学习兴趣作为教学的组织者,教师要善于创设教学情境,使学生产生新鲜感,激发其学习兴趣,使兴趣成为求知的向导,促进学生学习.激发学生的学习兴趣有多种方法,如以史料引趣,概率论与数理统计的发展史就是一部生动的创造史,可结合教学内容,选讲部分相关史料,介绍一些历史上著名的概率统计学家泊松、高斯、贝叶斯等对概率论的贡献及其研究方法、概率论的产生背景、某些概念的形成、发展等等[4],一方面可以激发学生的学习兴趣,同时也可吸收数学家在创造过程中反映出来的创造思想和方法.再如,以新知诱趣,在教学中适当介绍最新的科研成果,介绍不同学派在解决问题中的不同观点,使学生看到概率论与数理统计中的不确定的一面,需要继续探求的一面,以激励学生的创造精神;介绍概率论与数理统计在其他学科领域中应用,以开阔学生的眼界,在讲独立这部分内容时,提出是否有非独立的刻画,如何刻画,进而可以简单提出最近国际上正在研究的几种不独立的情况,再简要介绍随机微分方程、鞅的理论、随机场、点过程等新的概率统计分支的产生背景,使学生认识到概率论与数理统计的不断发展及其广泛应用,激发其探索意识及求知欲.

2.6培养创新能力“概率论与数理统计”作为一门重要的基础课程,渗透到了很多研究方向,尤其工科类和财经类.所以在教学过程中,应尽量给学生补充一些概率论与数理统计在相关专业中的应用实际模型,拓宽学生的视野,启发学生的思维,尽可能安排一些课堂讨论,布置一些课后阅读材料,培养学生的创新能力和适应社会发展的能力,提高学生的竞争力.

2.7采取多种考核方式“概率论与数理统计”是一门应用性学科,在注重理论的同时,更要检验学生解决实际问题的能力,所以,应采用多样化考核方式.例如,在总评成绩中加入实验成绩的比重;在平时教学中,可以布置一些综合性的课题,然后将学生分组,讨论解决问题,最后以提交报告的形式完成作业等等.这样既检测了学生解决问题的能力,同时也提高了他们科技论文的写作能力,为日后毕业论文的写作打下基础.

友情链接