首页 > 文章中心 > 正文

时代背景下大数据和统计学分析

时代背景下大数据和统计学分析

摘要:随着信息技术的飞速发展,大数据已成为当今时代的背景与代名词。对于大数据的发展与应用,不仅影响着这个世界,还改变着人们的生活。统计学,作为一种学科,同时也作为一种科学,在社会的发展进步中发挥着不可替代的作用。它不仅可以实现对数据的搜索与整理,而且还能对数据进行分析和归类,从而完成对特定事物的预测与判断,以此了解和分析相关事件的特点,论证事物发展的归因。特别是在近些年,统计学的应用更为广泛,甚至可以对未来的社会发展形势,以及个别领域的发展趋势进行精准的预测与计算。

关键词:大数据;统计学;数据科学;重心迁移

一、引言

在当多数人认为,因为大数据技术的出现,导致统计学专业,乃至于统计学领域都遭受到了较大的冲击。其实,这种认识是片面的,也是错误的。时代的发展进步也是科学技术的发展与进步,同时也是不断开拓与进去的过程。所以,新科技、新技术会随着时代的发展而被应用到当今的社会环境中。在此基础上,传统模式下的统计学科学与新兴领域中的大数据技术便实现了高效的有机结合,并且在两者有机结合的基础上实现了融合发展与创新的模式,进而开拓出了一个全新的局面与发展空间。同时,两者之间也在相互竞争的态势下不断提升自身的作用,完善自身的优势,从而实现了两种技术应用的平衡发展。

二、寻找发展机会,迎接未来挑战

不论任何行业,在面临机会的同时也是在面对更大的挑战。大数据的发展与建设同样需要从两个角度对其进行分析。在这一基础下,才可以真是的反映出大数据技术和统计学科学两者之间的关系。大数据技术,本质是一种数据科学计算技术。其涵盖了经济、交通、文化、医疗、教育与商业等各个领域。而且在任意领域中都体现出了完全不同的应用方式与应用价值,且都具有高度的复杂性与独立性。所以,当今我们所面临的主要问题并非“大数据与统计学谁更强、用谁更好”,而是应该考虑“如何利用大数据来解决社会各个领域的实际问题;以及能否在应用大数据的过程中融合统计学科学对其进行深度分析;或者能否在两者有机结合的基础上实现数据的绝对安全,及数据的高效管理与控制该如何实施等。”这是当前需要重点思考的问题,也是当今相关学者研究的重点范围。

三、大数据的应用状况分析

(一)基于互联网基础发展而来的应用技术

部分人认为,在当前社会中,大数据对社会经济的发展、人们的生活、工业的建设等覆盖是非常全面的。显然,这一想法并不成熟,至少在现阶段是不健全的。就目前来说,大数据无法实现对社会环境的全部覆盖,而是在不断覆盖的发展过程中。在大数据的覆盖范围之外,以及在互联网的应用范围之外,依然有很多我们无法通过信息技术对其进行有效控制的领域。就如,我们可以将以太网作为已经被大数据覆盖的领域与范畴,然后,将“暗网”或者“深度网络”作为未被大数据覆盖的领域与范畴。此时,便可以发现,未被覆盖的领域依然非常庞大。

(二)着眼于覆盖范围以外的可发展领域

大数据的覆盖可以为我们人类的生活带来很多便捷,且可以为社会的科学发展、经济建设以及文化传承等提供强大的动力。但是,我们却无法保证大数据在任何环境和任何领域中都能够为我们提供相应的服务。所以,大数据的覆盖范围以及应用空间虽然很大,但是其覆盖面积与覆盖率还是受到了较大的限制。该情况类似于通讯信号,一个信号基站周围若有阻断,便无法实现通讯的有效联通。因此,现阶段的大数据发展与应用更加注重于对未被覆盖的区域进行纵深发展与延伸。这样,可以让大数据技术的应用领域更加广泛,且可以让大数据惠及到更多的人,为其提供相应的服务于帮助。同时,在这一发展背景下,大数据可以实现更多区域的紧密连接,进而构建一个整体的数据应用体系,为将来的社会发展和进步提供相应的帮助与高效服务。同时,我们必须要借助统计学科学对其进行全面的创新与设计,以此来实现两者之间的有效配合。

(三)大数据与统计学的融合发展

我们在分析大数据技术与统计学技术的应用方法时候,一般会偏向于“哪一种更好,哪一种更精确,哪一种更有利”的模式对其进行分析与研究。在此,对于大数据和统计学的思考需要从两者之间的融合发展模式中出发,并分期两种应用技术在实现融合之后所体现的特征与优势。这一课题展开研究与探索。统计学科学有着大数据无法模拟与实现的人工应用技术和处理方法,但是大数据可以从根本上提高计算与分析的速度,且可以用来精确计算与分析其具体值,还可以在宏观条件下反映精确结果。所以,两者之间不存在优越性的比较或者代替作用。如果将两者看做是一个相互融合的体系,那么,大数据技术与统计学科学便呈现出了一种同步发展与应用的积极状态。

四、统计学和数据科学

(一)统计学和数据科学的关系

介于当前部分人员将统计学和数据科学混为一谈,在此笔者要对其提出质疑,而且笔者负责的指出,统计学和数据科学是两个个体,并非是一个整体。如果非要做出一个从属关系之分,那么,笔者宁愿将统计学看作是数据科学中的一个“分支”。严格意义上讲,可以把统计学作为一种“迈向数据科学”基础的路径与方法来应用。通过该方法,不仅可以明确什么是“统计测度”,还能搞清楚测度的显示形式,以及测度的具体方法和测度的计量方式,甚至可以定义出测度的具体维度与数据变化特征。由此可见,数据科学是统计学的发展基础,不论是从统计学来分析,还是从统计学的日常研究对象来判断,或者是从“统计的主题”做研究,都可以反映这一事实。

(二)科学关系的三个方面

第一个方面是大数据与统计学的问题提出;第二个方面是大数据与统计学的数据分析;第三个方面是大数据与统计学的方法应用。基于这三个方面,以一则案例进行分析:多年前,皮尔逊做过一个“父母酗酒对后代危害”的统计研究。最终研究结果得出:父母酗酒与后代的身高、智力、身体健康状况没有任何可直接表述的关联。但是却遭到了社会各界的抵触与反对,认为皮尔逊的统计结论太过于片面,而且认为“在统计过程中应用600户家庭,完全不注意代表全世界的人口”。如果将之放在今天来看,就是一个反应问题提出方法与数据分析方式以及方法应用措施的综合表现形式。众人皆知,导致后代身心发展问题的因素有很多,即便酗酒是一个噱头,如果体现在统计学的范畴中,其务必要有广域的数据分析,以及大量的数据研究才能得出最终结果。所以,若应用今天的大数据技术和统计学科学再对其进行一次分析与研究,相信可靠性会高出很多。

(三)科学的四个应用领域

在大数据应用技术与统计学应用技术实现融合发展滞后,对于社会的分析与研究需要从四个科学领域入手分析,第一是社会精神科学应用环境、第二是社会物质科学应用环境、第三是社会心理科学应用环境、第四是社会物理科学应用环境。基于这四个方面,可全面的反映出统计学是实现数据科学发展与应用的主要路径。而且,基于这四个方面进行统计研究,开展统计工作,组织统计运算,可以将社会中的各种事物最大限度的结合在一起,进而通过统计学应用技术对其进行研究与分析。

五、统计重心在大数据时代背景下的迁移

(一)总体模式下的样本数据发展

扎克伯格说:“给我全世界所有的数据,我可以改变世界的面貌。”从表面上理解,这是一句完全符合大数据技术和统计学科学的观点。但是,如果对其进行深度分析则会发现这一说法对于大数据的解释并不全面。在这句话中,就体现出了数据的样本与数据的总体这一概念。因为没有任何方法可以对全世界的数据进行总结,而且社会在不断发展,数据只是一种对社会发展态势的储存与记录方法,其反应的内容具有时效性,但是却无法对其进行长远发展的分析与应用。因此,想要应用现阶段的大数据改变整个世界的发展模式,可谓是无稽之谈。由此可见,在大数据技术的支撑背景下,以及统计学科学的研究过程中,都无法将数据看作是一个总体,而是只能在既定的范围内对其做出相应的分析与考量才能反映社会总体模式中的样本数据应用效果。

(二)关于数据识别的问题

数据识别能力对于大数据技术的构建与仿真具有很大的影响,甚至关系到了大数据分析的准确性与可用性。因此,在对数据识别的问题进行分析与研究的过程中,务必要结合相应的“产品或工具”,以及服务的范畴,受众群体等进行整体的完善与优化,以此来满足大多数人,对需要被覆盖的领域进行全面的覆盖。

(三)关于数据独裁的控制与防范

数据独裁,就是数据对人的控制,并且以此来统治人的行为。这一现象的主要危害在于,人很容易被经过严密分析的数据结果所迷惑,而且会将之认为是一种绝对科学的结果。这是一种过于依赖数据的现象,也是一种伪科学行为。为防止这一状况,务必要清新头脑,明白数据的使用方法与使用价值和使用场合,在此,以一实际案例作为佐证。例如:越战美军总指挥麦克纳马拉,将越战的细节利用数据的形式体现了出来,且认为美国必然胜利。最后,却被越军深诱到沼泽地带难以脱身。归根结底,就是他太过于迷信数据,反而忽视了其他可能干预到战争局势变化的因素。

六、结束语

由此可见,统计学可统计的领域正在不断的扩张与延续。大数据作为一种类似于统计学的技术,其应用功能和使用方法更为便捷,且在两者的融合状态下,可以完成更复杂的数据统计与分析内容。所以,在大数据技术与统计学科学的融合过程中,也是一个相互融合的过程。在这一状态下,可体现出更大的价值与作用。

参考文献

[1]马会宁.大数据驱动的云计算平台及其在统计学中的应用分析[J].中国集体经济,2019(36):97-98.

[2]徐艺歌.浅谈基于大数据背景下的统计学的应用[J].中国新通信,2019,21(22):108-109.

作者:何媛媛 单位:青岛市城阳区工业和信息化局