我国政务大数据政策的文本分析:推进逻辑与未来(2)
时间:2018-07-03 13:08 来源:网络整理 作者:墨客科技 点击:次
由此可见, 已有研究对政务大数据应用路径的探讨是比较系统的、对政策和案例的分析也是比较深入的, 但是依然存在深入的空间。例如, 没有针对“政务大数据政策”开展系统分析, 只是在分析政府出台的“大数据政策”中关注了政务大数据。作为大数据应用的核心领域, 政务大数据受到了很大重视, 与之相关的政策文件已经达到一定数量, 可以从中发现推进逻辑;同时, 也很有必要将政策文件反映出的推进逻辑与理论研究发现进行对比分析, 深入思考推进过程中存在的不足, 并针对未来发展提出相应的优化建议。 2、研究设计 2.1 政策文本收集 以中国政府网以及除香港、澳门、台湾外的31个省 (自治区、直辖市) 政府门户网站中与“大数据”相关的政策文本为数据源。具体收集方法如下:在网站“政策文件”栏目检索“主题词”或“内容”中含有“大数据”一词的全部政策文本;检索工作于2017年9月30日至10月2日期间完成;然后, 剔除大数据具体产业安排、大数据小组人员名单等与“政务大数据”主题不是直接相关的政策文本, 最终得到有效政策文本189条。 2.2 文本分析方法 运用Cite Space 5.0软件绘制相应的知识图谱对政策文本进行分析, 包括推进过程、热点领域、价值取向三个方面。由于Cite Space 5.0主要针对学术文献, 而不是政策文本。学术文献具有规范的元数据标注;应用于政策文本分析, 应首先做好元数据标注, 包括题名、关键词、来源机构、机构类型等字段。除关键词之外的字段通过人工方式标注。 关键词标注综合运用自动化和人工两种方法提取完成。对于“大数据”为全文高频关键词的政策文本, 使用“图悦”词频分析软件进行初步的词频分析, 然后基于词频和权重两项指标的综合测评得到关键词列表。例如对于《重庆市人民政府办公厅关于运用大数据加强对市场主体服务和监管的实施意见》, 先使用词频分析软件进行初步词频分析, 得到“政府”“监管”“重庆”“网上”“报告”“等150个关键词的词频和权重列表;根据词语的实际含义和相关程度, 排除“重庆”“月底”等词语, 最终得到“政府”“监管”等10个关键词。 对于“大数据”仅在某一特定段落高频出现的政策文本, 依据段落内容主旨、词语实际含义以及与“大数据”一词的相关程度三项指标进行人工提取。例如《北京市进一步做好防范和处置非法集资工作的管理办法》中, “大数据”为第五条“强化大数据监测预警, 加强行业数据整合与信息共享”的段落关键词而非全文关键词, 采取人工阅读的方法标注出“非法集资”“大数据”“信息分析”等6个关键词。 在关键词提取时, 遵循概念内涵尽可能具体的原则, 例如将“创新驱动”“创新服务”“科技创新”等作为单独的关键词, 而不是笼统地标注为“创新”。189条政策文本共提取1566个关键词项构成的关键词列表, 包含122个不同关键词, 对于其中内涵相近的关键词并不作合并处理, 而是在关键词共现网络等分析中聚合相应的概念内涵。 3、推进逻辑 3.1 推进过程 189条中央政府和省级政府政策文本的时间分布如图1所示。结合政策文本内容和标志性的政策文件, 可以将我国推进政务大数据发展和应用的过程分为3个阶段: 图1 中央政府和省级政府政策文本的时间分布 (1) 地方初探阶段 (2013年7月-2015年6月) :以2013年7月重庆发布《重庆市大数据行动计划》为开端;贵州出台《贵州省大数据产业发展应用规划纲要 (2014—2020年) 》、《关于加快大数据产业发展应用若干政策的意见》等, 对政务大数据应用展开实质性探索;浙江、江苏、福建、北京等地也在政策文件中引入“大数据”的概念。该阶段的核心特征是政策文件数量少, 而且绝大部分由地方政府出台, 国家层面的政策文件很少。 (责任编辑:admin) |