首页 > 文章中心 > 正文

大数据时代文学研究论文

大数据时代文学研究论文

一、大数据时代

对于新媒体文学意味着什么大数据让新媒体文学回到“去作者化”的共在混融状态:在传统声音媒介时代,读者与作者共同创作、修改诗歌;到了纸质媒介时代,作者的地位上升;在新媒体文学时代,读者可以对作家进行积极主动的反馈,但这种反馈呈现出信息零碎化、评价随性化以及无法把握所有地域、身份、族裔的不完整状态;到了大数据时代,新媒体文学借鉴《纸牌屋》的数据挖掘模式,可以对读者信息进行全数据收集整理,以最大的吸引力呈现一个文本(其中包括一种可能性,即同一个故事开头,针对不同人群有不同的故事演进和情节,乃至人物设置)。舍恩伯格认为,“大数据是指不用随机分析法这样的捷径,而采用所有数据的方法”,因此,我们分析的大数据其实应该被称为“全数据”。在网络新媒体时代,人类所有的网络行为都可以被数据化,而这些数据又能完全被收集、存储、交换和分析。人们在不经意之间产生的数据总量大到我们难以想象的程度。“据有关研究报告,2013年中国产生的数据总量超过0.8ZB,相当于2009年全球的数据总量。预计到2020年,中国产生的数据总量将超过8.5ZB,是2013年的10倍,一个大规模生产、分享和应用数据的崭新时代正在到来。”新媒体文学在发展过程之中当然也生产了大规模的数据,这些数据对新媒体文学意味着什么呢?第一,以PC和移动终端为主要载体的新媒体文学产生巨大的相关信息数据库,比如新媒体小说阅读量排行榜、新媒体作家数据库、读者阅读时间和习惯、哪些文学章节被反复阅读等等。与此同时,因为网络媒介的公开性和“无门槛”标准,新媒体文学的阅读者和创作者数量达到了文学史上前所未有的奇迹。2014年,中国网络文学的读者已突破5亿人,保守估计整体收入突破65亿元。这样大规模的用户群保证了巨大的数据量,也使文学网站拥有所有与网络文学相关的数据。网络文学带来的巨大经济效益成为对网络文学进行大数据分析的资本基础和动力。作为迄今为止最为强大的分析技术,大数据的重要价值在于预测趋势,即“正在发生的未来”。通过对这些大数据的分析,内容生产者可以有针对性地将作品推送给受众,而这种经过精心设计的文学作品恰好就是受众所需要的。这是因为大数据分析可以采用理想状态的全数据分析(目前还不能完全达到),而全数据分析由于分析的数据量巨大,单个数据的误差可以在分母巨大无比的全数据海洋之中被忽略。相反,在数据量有限的时代,我们就只能追求单个数据的精准。“因为收集信息的有限意味着细微的错误会被放大,甚至有可能影响整个结果的准确性。”当数据量持续积累增加时,对单个数据的精准性追求不是全数据的方式,放弃精准性、适度接受不精准性,仍然不会影响其结果。这类似于医用手术无影灯,从各个角度照射对象,永远不会存在盲区。盛大文学董事长邱文友认为,事实上国内文学网站在10年前就在运用大数据思维了:文学网站上有200多万名作家,700多万部作品,怎么在茫茫作家海中找出下一个唐家三少?靠数据分析。此外,在网络连载过程中,作家跟读者之间有互动,这些讯息也是数据。“比如作家本想让甲娶乙,可是绝大部分读者希望甲娶丙,这时候作家可以选择,是按原来思路,还是按小说可能延伸的商业价值去改写结局?所有决策的因素、动机跟方式,也是数据分析。”瑏瑡但是受网络技术发展的限制,当时新媒体文学的数据挖掘不可能像现在这样彻底和全面。第二,大数据时代新媒体文学批评走向多元化。当前的新媒体批评既包括传统精英式的学院派批评,也包括点赞、跟帖式的草根批评;学院派批评以黄鸣奋、欧阳友权为代表,草根批评以崔宰溶为代表。“黄鸣奋和欧阳友权以从西方新媒体技术层面发展出来的超文本理论作为理论生发点,对网络文学进行后现代性的学理探讨。”瑏瑢而崔宰溶认为,对中国网络文学的研究需要从原著理论(vernaculartheory)和网络性理论入手,才能真实地对新媒体文学进行研究。新媒体文学的接受者并不会以文化精英式的方式来俯视作品,他们对新媒体文学的批评是纯感受性的、本能直观的和零散局部的。这种自下而上的反叛式文学批评,迥异于传统精英式的学院批评。对中国新媒体文学的研究必须从网络的“原著居民”(网络文学读者)出发,由于他们大部分时间栖居于网络之中,因而对新媒体文学具有不受传统文学理论影响的本性感受力和知识系统。瑏瑣笔者认为,无论是西方网络文学理论还是原著理论,在大数据时代,它们都会被作为大数据库中的一个组成部分,再结合“总点击量”“总推荐”“月排名”等进行分析,从而寻找出读者最有可能喜欢的作品。无论如何,大数据时代给新媒体文学研究带来一种新实证研究路径。米埃尔(Miall)认为,文学的实证研究像灰姑娘一样总是被人们忽视或反对,早晚会有一天,实证研究将统领整个文化研究领域。人们会通过实证来研究理论观念,反思文学的本质和文化地位。瑏瑤网络技术的发达与新媒体文学的繁荣促成了大数据分析对于新媒体文学的数据实证性研究。

二、大数据思维给新媒体文学带来的理论思考新媒体文学的大数据分析

从学理上带来三组思考:一是大数据推动了新媒体文学的发展,然而新媒体文学能被彻底数据化吗?如果不能,那在什么样的层面上可以被数据化?新媒体文学与大数据思维融合的真正重要意义在何处?二是新媒体文学遭遇大数据思维之后,是否意味着对于新媒体文学的研究可以完全转换为数据式的实证研究?如果不能,对新媒体文学的研究还有哪些方面是大数据不可能涉及和完成的?三是当我们将文学接受者的大数据作为文学创作的唯一和最高标准之后,新媒体文学在题材选取、形式美学和叙事节奏等方面是否走向绝对迎合读者的趋势?如果是的话,新媒体文学作家的意义何在?他们又应该采取迎合还是引领的姿态呢?

第一,新媒体文学活动都发生在网络之上,因而可以被充分数据化。大数据自产生之日起,就迅速与人类已有的知识和学科产生了极强的关联,比如医疗健康、交通规划、公共管理、教育培养等领域都在你看不见的地方悄悄运作着大数据分析。“大数据时代的经济学、政治学、社会学和许多科学门类都会发生巨大甚至本质的变化和发展,进而影响人类的价值系统、知识体系和生活方式。哲学史上争论不休的世界可知论和不可知论都将转变为实证科学中的具体问题。”瑏瑥大数据的此种趋势根源于它能将所有网络行为数据化的能力,比如在新媒体文学活动之中,我们可以轻松采集到作家和读者的数量、年龄层、分布地域、经济状况、教育程度、阅读习惯、题材喜好,等等。除此之外,大数据可以分析:哪种题材的文学受众最多?同一种题材之中,什么样的文学桥段让读者喜欢?幽默、推理、悬疑还是浪漫?文学作品之中什么样风格的语言会更受哪种人的喜爱?什么样的故事情节发展路线和结局是最受人欢迎的?等等。这些方面都可以通过读者的评论和阅读数据反馈到内容提供商和文学作家那里,从而对作品进行实时调整。但是,我们不能因为大数据有这样的效果,就认为新媒体文学可以被完全大数据化。其实,作为技术和艺术合一的新媒体文学在多个维度上是不能被量化的,比如作家的灵魂高度、文学思想的深邃性、文学的意境、文学的美感、文学的终极关怀和文学对人性的探测等都不能被量化,而这些维度恰恰是文学之为文学最核心的内容。不管大数据技术怎么发达,它所追求的绝对客观性其实在数据产生之初就不存在。数据无论在表面上看起来多么客观地再现对象情况,它本身其实是在一种具有倾向性和差异性价值观基础上被建构的。因而,大数据的生成和分析永远不可能摆脱自己天生就具有的价值主观性。我们能看到的数据是研究者有能力或者热切希望看到的数据,若非如此,即便大量数据生成了,也不能被数据识别系统发现。这就好比雷达效应,你的关注点除了对象之外别无他物,但是“他物们”却客观大量地存在于你的意识之外,只不过你无意或不能去抓取它们。所以,大数据不管看起来多么科学客观,背后其实与主观价值判断是分不开的。“大数据”并不等同于“大智慧”,即使占有大量的数据,还必须有对数据具有专业化分析能力的人。Netflix的CEO里德•哈斯廷斯利用数据分析的方法也是受他前期从事碟片租赁服务的启发。他一方面熟悉在网络上怎么通过数据分析为别人推荐自己喜欢的电影和电视剧,另一方面他在无数的观影之中对影片具有极强的审美鉴赏能力。科技和人文的结合让他具有对《纸牌屋》数据进行采集和分析的能力,这才是Netflix进军艺术界成功的原因。所以,同样的大数据在不同主体那里得出的结论或者采取的应用是相距甚远的。就好比同样是医学CT扫描,仪器是相同的,照出的片也是相同的,为什么大家愿意去权威医院检查呢?问题的根源在于对CT成像进行分析的医生水平,同样的CT成像,在拥有不同经验的医生那里得出的结论很可能有天壤之别。大数据作为一种技术在教育、电影、艺术等人文领域广泛运用已是不争的事实,除了让人文领域的成果与经济效益直接产生关联之外,它的最重要意义其实是在哲学思维层面。大数据分析使我们抛弃传统哲学一直追求的现象背后的原因,而转向为关注事物和事物之间的关系性,即从因果关系转变为相关关系。瑏瑦这种思维方式转变是顺应时代的实用需求而产生的。一方面,大数据思维不去深究因果关系,而是绕开因果关系,退到因果关系的上层———相关关系(包含因果和非因果关系)。这种搁置因果的选择更是由于因果关系和相关关系之间复杂的关系:“(1)两个事物间有因果关系时,这两个事物间往往会有相关关系;(2)两个事物间不存在因果关系时,这两个事物间也可能会有相关关系(虚伪相关关系);(3)两个事物间有因果关系时,这两个事物间也有出现零度相关关系的可能(虚伪零度相关关系)。”瑏瑧当略过这些复杂关系,只关注“相关关系———结果预测”,就会省去无数不必要的麻烦,而直接得出需要的答案。“相关关系的核心是量化两个数据值之间的数理关系。相关关系强是指当一个数据值增加时,其他数据值很有可能也会随之增加。”瑏瑨2004年,沃尔玛公司分析顾客消费时的各种数据时,意外察觉到数据和数据之间的相关性:飓风来之前,手电筒和蛋挞都销量增加,因而超市毫不犹豫地将它们放在飓风用品附近。这个例子就表明在大数据时代,深究原因并不一定能找到答案,而对数据进行相关性分析才是其核心。另一方面,大数据带来的相关性分析由于技术的成熟变得比因果分析更容易。丹尼尔•卡尼曼(DanielKahneman)甚至认为,人类之所以一直热衷于因果关系思维,是因为在信息不发达的社会采用因果思维可以快速地作出决定。相反,在那个时代如果采用相关思维会特别费力且不可能有任何结论。大数据由于技术的支撑完全可以支持相关性思维,但我们在现实之中会发现传统因果思维得出的结论被置于大数据时代后是有问题的。

第二,新媒体文学的学术研究与新媒体文学的大数据研究不能混为一谈,二者采用的研究方法不同,而这两种方法也只有被局限在一定范围之内才能发挥出自己的长处。19世纪,类似大数据思维的实证主义就已经僭越过文学的领地。当时实证主义提出,表象本身才是具有研究确定性的对象,对象背后所谓的本质是并不存在的。实证主义“反对追求绝对的知识,它停止去探求宇宙的起源和目的,拒绝认识诸现象的原因,只专心致志地去发现这些现象的规律,换言之,去发现各种现象的承续与类似的关系”瑏瑩。实证主义的“只研究怎么样(how),而不研究为什么(why)”瑐瑠主张与大数据思维追求相关关系而悬置因果关系的方式极为相似。文学虽然作为语言的艺术具有强烈的主观情感色彩,但是对文学的研究在很大程度上可以采用实证主义的方法,比如对文学流派、文学史、作家时代背景、作品传播状况的研究等。实证主义既要有“实”,又要有“证”:从研究对象入手得到大量材料,在此基础上,还需要进行分析论证的过程,否则材料只是死物。反过来,我们认为实证主义精神只能限定在以上研究领域才是对文学研究有益的。如果实证精神进入文学意义范围,文学的灵魂、精神和审美只能被理性实证逻辑消解磨灭,最后成为他者的“嫁衣”。从传统的实证主义对文学的研究经验可知,任何一种研究方法是不可能包打天下的,对文学研究不同的维度只能用不同的方法。针对新媒体文学的实证主义(大数据思维),只能研究新媒体文学的,即对新媒体文学的传播效果进行分析,预测新媒体文学会怎么样,提供什么样的文学作品其传播力更强等。然而,对新媒体文学研究本身就不能是技术式的,而应该是美学式的。在具体研究方法上,新媒体文学与传统文学走的是不同的理论路线。但就其艺术品格来说,文学应该研究的依然逃不脱深层的价值审视:从感官刺激的表层能否将读者引向一般生活状况,如生死、战争、世俗、宗教等,进而感受人类的终极意义和终极关怀。即使新媒体文学从表征上带有后现代的去中心、平面化和反经典的倾向,但我们还是坚信好的文学与人性追求是同一的,狂欢式的浅薄带来的是“娱乐至死”的悲哀。

第三,大数据思维带来的新媒体文学审美形态是不是对大众的迎合呢?纯粹的迎合带来的是否只是新媒体文学短时期虚假的繁荣?众多网络之中是否有一批逆潮流而上的引领美学品味的真正意义上的作家呢?如果只是一味迎合大众趣味,以大数据的反馈作为依据,新媒体文学到一定阶段完全可以通过技术手段调整写作的内容和风格,这样作家就成了读者们意见的平衡机制,这样的新媒体文学家没有太大的存在必要。我们可以设想一种状况:一部小说,作家只需要给一个开头,后来的情节发展完全通过数据汇聚网民的意见和倾向进行延伸,最后,小说成为读者们合力形成的整体,这样的小说(姑且称其为小说)就是优秀的文学作品吗?真正伟大的作家并不迎合当下的恶俗状况,而是写出深刻的作品,慢慢培养读者的审美趣味,让我们真正感受文学的意义、领悟存在的价值、思考人生的真谛。就像史蒂夫•乔布斯做苹果手机一样,他坚持认为不用考虑消费者的兴趣,你需要做的是培养和引领审美。两种不同的文学态度使得对文学具有深入思考的作家陷入两难境地:迎合还是引领读者和市场?迎合读者型的新媒体文学只需要通过大数据分析带给读者们娱乐风格的作品,这种作品只需要考虑文字故事如何带来感官的愉快,读者怎么舒服怎么写。引领型的新媒体文学有一个共同特征———“反浅薄”,文学作品需要读者理解力的参与和感受力的调动,从作品之中读到的除了“文之悦”之外,还有深邃的心灵和精神层面的内容。新媒体文学植根于众生喧哗的网络媒介之中,但是我们不能据此将新媒体文学必然地视为通俗艺术。新媒体文学不一定必须提供短暂的、不能激发任何智性思考和审美挑战的作品。在新媒体之中不可能存在可以吸引所有读者的文学作品,因为这就是新媒体的性质:作家创作风格的多元存在和读者审美兴趣的散点式分布。也就是说,新媒体文学的审美情趣和属性不是由它所寓居的媒介来决定的,而是由作家自己的选择决定的。网络媒介带给人表达的自由和平等,从而带来大众极大的参与兴趣和阅读快乐,其中不乏并未获得话语权的精英作家。所以,新媒体文学应该生长在一个包容性极强的场域之中,否则,引领文学潮流的作家就不可能拥有宽松的成长环境。但是,如果我们单纯用技术方式来衡量艺术,艺术将会走向媚俗的商业逻辑道路,而优秀的艺术因其表征具有长期性会被戴着大众文化眼镜的数据技术过滤掉,剩下的只是众生喧哗的靡靡之音。

作者:徐杰单位:西南民族大学文学与新闻传播学院讲师