文章正文

诗词 散文 小说 杂文 校园 文苑 历史 人物 人生 生活 幽默 美文 资源中心小说阅读归一云思

基于CSSCI的“大数据”高被引论文统计与主题分析

时间:2023/11/9 作者: 图书馆界 热度: 15905


  (湘潭大学公共管理学院,湖南 湘潭 411105)

  随着互联网、物联网、云计算和三网融合等通信技术的发展,人类社会已进入大数据时代。大数据作为一种强大的管理方法,被广泛应用到农业、商业、金融、医疗、社会安全等各个领域,其强大功能和广泛应用引起了政府高层的重视。2015年,国务院印发的《促进大数据发展行动纲要》明确部署了在未来5到10年间推动大数据发展和应用,打造精准至理、多方协作的社会治理新模式。2016年发布的《中华人民共和国国民经济和社会发展第十三个五年规划纲要》第二十七章“实施国家大数据战略”中也明确提出,要“把大数据作为基础性战略资源,全面实施促进大数据发展行动,加快推动数据资源共享开放和开发应用,助力产业转型升级和社会治理创新”。国家政策的导向和信息技术的发展,引发了“大数据”主题研究热潮。近年来,学者们从各个层面各个角度对“大数据”展开了全面探讨与研究,也产生了很多有影响力的研究成果。为了更好地把握大数据的研究现状与发展方向,对“大数据”主题的研究成果进行梳理和分析是有必要的。

1 数据来源与研究方法

在CNKI中以“大数据”为题名进行检索,可以检索到 60 329 篇相关论文,而主体部分分布在近5年以内,可见随着大数据的广泛应用,大数据研究越来越受到学术界关注。中国社会科学引文CSSCI所收录的期刊论文是学术界公认的学术质量较高的论文汇集,而其中高被引论文指标也是论文的学术含量的重要指标之一,为使研究有针对性,本文选取了中国知网CSSCI收录的“大数据”主题高被引论文进行分析。以题名=“大数据”+期刊范围=“CSSCI”进行组合检索,得到包含“大数据”题名的论文 3 551 篇,再用“被引”≥30进行筛选,检索到高被引论文288篇。经分析288篇论文中不含会议摘要、人物访谈等报道类文章,全是研究性学术论文,因此选择这288篇论文作为研究样本。下文分别从论文的年份、作者集中度、作者机构分布、期刊构成、基金构成、高频关键词、论文主题等方面进行分析。

2 论文数据分析

2.1 论文年份分布

论文数量的变化是衡量某领域研究发展的重要指标,这对预测该领域的发展态势具有一定的参考作用。经统计CSSCI期刊中288篇“被引≥30”的“大数据”主题论文(以下简称“‘大数据’主题论文”)分布年份如图1所示。

  

  图1 “大数据”主题高被引论文年份分布

  在288篇“大数据”主题论文中,以2014年所占比例最多,其次为2013年和2015年,可见论文数量趋势也反映了近几年是大数据主题研究的高峰期,另外2016年与2017年大数据主题论文分布较少,因为论文上传时间较短,其被引概率低于前几年是正常规律。

2.2 论文作者分布

对“大数据”主题论文的作者集中度进行研究可以分析该主题研究是否形成稳定性作者群体。经统计288篇论文共有作者556位,其中著有5篇论文的有喻国明、甄峰2位作者;著有4篇论文的有李晨辉、张兴旺、唐斯斯、秦萧、李广建、杨现民6位作者;著有3篇论文的有彭兰、化柏林、迪莉娅、麦范金等8位作者;有冯芷艳、郭迅华等40位作者著有2篇论文;余下500位作者均著有一篇论文(见图2)。从论文作者分布可以看出,绝大多数作者对大数据研究属于分散性研究,对大数据领域的研究还未形成稳定的核心作者群。

  

  图2 “大数据”主题论文作者数量与论文篇数分布

2.3 作者机构分布

作者所在机构的构成分布是大数据研究的指标之一,这一指标能有效反映现有的机构与行业开展大数据研究的情况。我们把作者单位分为高校与职院、研究所与图书馆、出版社、企业、其他五大类型,统计发现作者机构分布如图3所示。

  

  图3 “大数据”主题论文作者机构分布

  注:1)同一作者隶属于几个单位的,只计算第一个单位;2)各类行业协会计入研究所机构;3)其他机构主要包括政府行政部门、税务局、水利局、医院等。

  对作者机构分布的分析可以看出,当前开展大数据研究的作者绝大部分集中在高校与职院(78.60%),其次是研究所图书馆(14.93%)。虽然大数据已广泛应用到社会管理、农业、商业、金融、医疗、安全等各个领域,但进行大数据研究的主体仍然集中在高校与科研所机构,应用性部门很少开展大数据研究。

  同时,我们对发文量较高的机构进行了详细统计,发表“大数据”主题论文较多的机构如表1所示。

  

  表1 “大数据”主题论文发文数量高的机构分布

  如表1所示,中国人民大学发表大数据论文22篇,清华大学、武汉大学、南京大学、华北师范大学发表大数据论文10篇以上,另有复旦大学等14所高校与国家信息中心发表大数据论文在4—8篇之间。可见,以中国人民大学为首的20所高校与研究所在大数据研究领域发挥核心作用。

2.4 论文发表期刊分布

笔者以CSSCI期刊的学科分类为主要依据,对发表大数据论文的期刊进行了归类分析,统计数据如图4所示。

  

  图4 “大数据”主题论文发表期刊分布

  目前,“大数据”主题论文主要集中刊发在新闻传播、图书情报、教育学、管理学、经济学、综合社科与其他等六个学科类期刊,其中图书情报、教育学、综合社科类期刊发文数量最多。发文期刊也在一定程度上反映了“大数据”主题论文的主题分布,由期刊分布能大致推断目前研究者们对大数据在新闻传播、图书情报、教育学、经济学、管理学等领域的应用研究较多。

2.5 论文基金支撑分布

笔者以“是否有基金支撑”对288篇“大数据”主题论文进行分析,统计数据如图5所示。

  

  图5 “大数据”主题论文基金支撑分布

  注:部分论文有多项基金支撑,本文只按最高级别基金统计。

  从基金支撑可以看出,“大数据”主题论文的基金支撑比例非常高。288篇论文中,有国家级别基金支撑的接近40%,有省级基金支撑的占15.28%。这一项数据的分析可以看出,当前我国各级科研主管机构对大数据研究的支持力度较大。

2.6 论文高频关键词分布

“大数据”主题论文的高频关键词是反映论文的主题内容与研究倾向的重要指标。笔者对288篇论文的关键词进行了汇总分析,并选取了“出现次数≥5”的关键词进行分析,如表2所示。

  

  表2 “大数据”主题论文高频关键词分布

  由表2可知,“词频≥10”的共有大数据、学习过程、大数据时代、数据种类、数据分析、物联网、数据拯救,隐私保护、社交网络,数据分析、用户需求、数据环境、数据样本、非结构化、数据技术等17个关键词,另出现频率在5—9次的关键词有24个。高频关键词的出现频率在很大程度上反映了大数据研究的内容热点。因此,通过关键词指标可以反映出数据种类、结构分析、用户需求、社交网络、新闻传播等领域都是当前“大数据”主题研究的热点。

3 大数据论文内容与主题分布

研究的内容和主题分布是体现大数据研究现状最重要的指标,通过对288篇论文的题名、关键词、摘要和部分论文的全文进行阅读分析,可以发现大数据研究的热点主要集聚在以下几个方面。

3.1 大数据本质与算法研究

288篇论文中,有50篇是从大数据自身逻辑思维、算法结构、源起与发展等方面展开研究的。如钟瑛、张恒山、涂子沛对大数据的概念、缘起与发展进行了分析,介绍了大数据的特点,并预测了大数据的发展方向;秦晓珠、李晨辉等指出大数据知识服务的实现需要解决大数据的可表示性、可处理性、可融合性及可靠性四个关键问题。邱仁宗、黄雯、齐爱民等探讨了大数据的研发、创新和应用,提出应建立数据主权原则、数据保护原则、数据自由原则和数据安全原则;薛孚、陈红兵指出大数据的应用引发了隐私伦理挑战,应通过提高数据用途透明度、调整个人隐私观念、搭建共同价值平台、寻求合理的伦理决策点等对策,提高价值与行为的一致性,解决数据伦理问题。邓仲华、刘伟伟对大数据挖掘的内涵进行了探讨,提出了云计算与挖掘服务融合的大数据挖掘体系架构。

3.2 大数据应用于教育研究

分析288篇论文的研究主题后发现,大数据应用于高等教育是大数据研究的热点。有57篇论文分别从教学手段、教学效果、教学管理等方面对高等教育大数据应用进行研究。如喻长志指出大数据将会对整个社会教育系统产生革命性影响,大数据技术将重构学校教育模式;魏顺平、杨现民探讨了如何建立教育数据管理系统,利用大数据实现教育管理数据化、科学化,驱动教学模式改革;王莎、黄欣荣、胡树祥、林家峰等探讨了如何利用大数据分析探究思想政治教育的深层规律,提高高校思想政治工作效率;杨满福、杨永林等从利用大数据优化课程教学方面展开研究;黄如花、张晨等探讨了大数据时代如何加强大学生信息素养教育。总之,从研究现状来看,开发利用大数据价值、改革教育模式、优化教育手段,促进大数据与教育相融合发展是当前“大数据”主题研究的热点之一。

3.3 大数据应用于图书情报研究

大数据时代的来临给图书情报服务工作提供了新的机遇,也带来了新的挑战。大数据是一种数据分析思路与方法,应用大数据开展图书情报工作是大数据研究的热点之一。在288篇论文中,有45篇是关于大数据与图书情报的融合研究的,如王天泥提出知识咨询是未来图书馆的重要发展方向,图书馆应利用大数据分析加强知识咨询服务建设;陈臣、马晓亭、杨亮提出图书馆应利用大数据构建用户个性化智慧服务体系,同时要加强用户隐私保护;陈传夫,钱鸥等从资源融合、数字知识服务、财政投入机制、知识产权风险方面探讨大数据在数字图书馆的应用;樊伟红、李晨辉等分析了图书馆可以利用大数据进行风险预测和用户流失评估和价值分析;李晨辉、白如江等探讨了大数据时代如何构建科学知识服务平台,整合集成科学数据,实现科学数据共享。可见,大数据与图书情报的融合研究是比较全面和深刻的。

3.4 大数据应用于政府管理研究

在288篇论文中,有34篇从大数据在政府宏观管理中的应用切入研究,如刘浩、刘叶婷等从政府治理理念、政府治理范式、政府社会管理等方面探讨了大数据时代政策管理的机遇和应对策略;胡洪彬、高华丽、王向民等指出大数据正在改变社会政治形态和国家方式,国家行政部门应通过传播大数据理念,完善相关机制,转变治理模式,强化技术研发和培育专业人才等措施实现国家治理转型,促进国家治理决策民主化、科学化;陈之常、于施洋、胡税根提出基于大数据建设政府智慧政府门户的构想;沈亚平、黄铧焕等提出大数据时代电子政务开放、协同制度建设等措施;马奔、毛庆铎等分析探讨了大数据分析在政府应急管理部署工作中的应用策略。可见,学者们对于大数据在政府管理中的应用十分关注,也从各个层面展开了研究。

3.5 大数据应用于企业管理研究

利用大数据管理海量的企业信息是现代企业管理的重要手段。在288篇论文中,有22篇是研究如何利用大数据进行有效的企业管理,如冯芷艳、郭迅华等探讨了大数据背景下企业网络生态系统及其协同共生机制、市场营销和商业模式创新等重要课题;黄升民、刘珊等指出大数据从媒体、消费者、广告与营销战略策划、效果评估四个层面解构了传统营销体系,也重构了大数据背景之下的全媒体营销体系;吴金红、张飞等从情报意识、情报组织团队、竞争情报系统以及情报安全制度等几个方面探讨了大数据时代企业竞争情报工作的重点;陈林、唐杨柳等以大数据为分析手段,研究了混合所有制改革对国企的政策性负担状况;沈弋、徐光华、王正艳等分析了大数据时代企业责任信息的产生、传递以及储存规律;徐艳、闫华红、毕洁等分别对大数据时代企业的人力资源绩效管理、企业财务管理转型、企业预算与危机应对等方面进行了研究。

3.6 大数据应用于统计、税收、金融工作研究

海量信息与统计工作直接相关,把大数据与金融、计量、税收等工作进行融合研究是大数据研究的热点之一。288篇论文中,有30篇是研究大数据在金融、税务、计量等领域的应用,如秦荣生分析了利用大数据、云计算技术促进持续审计方式的发展;李金昌探讨了大数据与统计新思维,即认识数据的思维、收集数据的思维和分析数据的思维;许小乐、邱东从理论上分析了统计学与数据科学的关系和大数据潮流对统计学产生的影响;孙杰、蔚赵春分别从大数据时代互联金融创新、商业银行的大数据应用策略、大数据时代商业银行的转型升级策略等方面探讨了大数据在金融领域的应用;王向东、刘磊、谭荣华等分别从税务改革、大数据理税方面探讨了大数据在税务管理中的应用策略。

3.7 大数据应用于新闻传播与出版研究

信息时代海量的新闻信息源、信息受众及其反馈信息都直接关系到传播效果,应用大数据对新闻传播进行管理也是当前大数据研究的热点之一。288篇论文中,有25篇论文从新闻传播角度研究大数据的应用,如张涛甫、汤景泰等分析了大数据时代给传统媒体带来的冲击,指出传统媒体可以抓住大数据环境下受众对高品质、确定性信息的需求,寻求战略突围;喻国民分析了大数据方法与新闻传播价值逻辑之间的矛盾,探讨了新闻大数据的数据源的开放获取方法;徐锐,万宏蕾提出开发利用数据新闻,通过数据搜集、数据处理和数据呈现打造新闻生产核心竞争力,并加快整个新闻行业的角色转换;喻国民、唐涛等分析总结了网络舆情的大数据特征,提出应根据大数据思维进行网络舆情分析与引导;聂磊从媒体受众的角度探讨大数据时代如何提升新闻传播效果,并对受众进行动态跟踪与分析。另有9篇论文研究大数据与出版业的融合发展,分别从大数据在数字出版、众筹出版、科技期刊出版与统计、图书营销等方面的应用进行了探讨分析。

3.8 大数据应用于社会其他领域研究

除了以上研究热点,还有少量“大数据”主题论文分散于社会各行业的主题研究中:有4篇论文从信息安全与个人隐私角度研究大数据的应用策略,有1篇论文论述了大数据治法,有2篇论文涉及交通管理与安全,有1篇论文从大数据角度研究语言应用,有2篇论文研究人文地理主题,有1篇论文从大数据角度研究体育,有1篇论文研究利用大数据方法开发旅游信息,有1篇论文研究以大数据手段管理犯罪信息,有1篇论文从大数据角度研究物流管理,有3篇论文研究以大数据手段开发广告营销。可见,关于大数据的研究广泛涉及社会各行各业的应用与发展,但从整体规模而言,对大数据与社会各行业的应用融合研究还是相对较少的。

4 分析与建议

从大数据研究论文整体规模而言,近几年大数据研究论文数量大,研究范围广,高质量的研究成果也大批涌现,但仍然存在一些不足。通过对CSSCI的“大数据”高被引论文进行分析总结,笔者认为,目前关于大数据相关研究应在以下几个方面予以拓展和改进。

4.1 拓展大数据主题研究领域

从上文分析可以看出,高等教育、新闻传播、图书情报、政府管理、企业管理、统计、金融等领域是大数据论文研究的热点。在288篇论文中,除了20篇之外,绝大部分论文涵盖了这些研究热点。大数据作为一种结构化、半结构化的海量数据广泛地存在所有的行业当中,具有研究和开发的价值。因此,把大数据的理论、方法应用于所有社会行业,把大数据研究广泛拓展到社会各行各业的实践领域是很有必要的。除了现有研究热门领域之外,还应该广泛地把大数据与农业、经济、文化服务、零售业、交通运输、房地产业、基础教育、城市规划、公共设施管理、居民服务、社会服务与保障、社会心理、健康卫生、文体娱乐等各个行业进行融合研究,探讨大数据时代如何有效地应用大数据方法收集、分析各行业的数据资源,应用数据分析促进传统行业的转型升级发展。

4.2 加强理论与实践融合研究

通过对288篇“大数据”主题论文进行分析,可以发现现有的研究更多侧重于理念和思路的探讨,缺乏方法和实证研究。在288篇论文中,几乎绝大部分都是进行理论分析和泛式的探讨,仅有极少数论文结合了案例进行研究,如王波的《南京市区活动空间总体特征研究——基于大数据的实证分析》,徐琦、宋祺灵的《国内电视媒体大数据新闻实践探析——以央视新闻为例》。但从研究规模而言,这类实证论文数量极少(不足20篇);从研究层次来看,大多数实证研究论文多侧重于对案例进行描述性介绍,方法上也多止于简单讨论,缺乏对大数据的算法逻辑、数据验算、结论分析等深层次的、有针对性的实证研究成果。这种研究现状呈现给读者的多是一些描述性印象,因此建议学者们在今后的研究中应多关注大数据在各行业的实证表现,客观、深入地探讨大数据与各行业的融合发展现状,以真正验证大数据工具对于社会各行业的价值。

4.3 加强大数据伦理与信息安全研究

大数据时代也被称为“共享时代”,大数据要求实现数据的自由、开放和共享,而信息的公开与信息安全是一对天然的矛盾,由此也带来了个人隐私保护问题,进而带来人类的自由与责任等深层次伦理问题。但在288篇论文中仅有5篇论文专门对大数据伦理进行探讨,仅有2篇论文论述了大数据时代的信息安全问题。从现有的研究成果来看,多是对信息伦理与信息安全的较为浅表层面的描述,缺乏对人类信息公平、信息垄断等信息矛盾问题的深层次分析,未能提供解决信息共享与信息安全矛盾的具体运作方式。因此,今后的研究应更多地关注大数据伦理与信息安全研究,尤其应加强实证研究,对现实案例的具体运作方式与矛盾思考进行分析研究,以探讨大数据时代良性信息生态系统的具体运作方式,达成海量数据的挖掘、共享和信息隐私保护双方面的协调与平衡。

4.4 拓展国外大数据应用研究

大数据是一个世界的课题,自2011年EMC在美国举办第11届EMC World大会上正式提出“大数据”概念以来,大数据就成为全球研究的热点,以美国为首的西方发达国家和许多国际组织、跨国企业都十分重视大数据的应用与研究。推介、分析国外大数据应用研究状况对我国的大数据研究与应用也是极具借鉴意义的。在288篇论文中,仅有5篇研究国外大数据应用与发展状况,如张勇进的《主要发达国家大数据政策比较研究》,王忠的《美国推动大数据技术发展的战略价值及其启示》,蔡翠红的《国际关系中的大数据变革及其挑战》《美国推进大数据的应用实践及其有益借鉴》等。因此,学者们开展大数据主题的研究应着眼于全世界尤其是欧美发达国家,以全球视野研究大数据的应用与开发,更有效地促进我国大数据的研究应用。
赞(0)


猜你喜欢

推荐阅读

参与评论

0 条评论
×

欢迎登录归一原创文学网站

最新评论