设为首页   加入收藏
   学术论坛
促进税务大数据发展的现实思考与应对策略
日期:2020-02-14    来源:龙岩市税务学会   

 

程辉

 

【内容提要】随着互联网技术在税收领域的广泛应用,海量涉税数据对当前税收管理思维、技术手段、法律体系等构成重要影响。在大数据时代下,税务工作既迎来了一定的发展机遇,又遇到了多种挑战,大数据是税收现代化的利器,建立国家税收大数据库,强化大数据分析应用,是互联网 + 税务的必然选择。本文分析大数据对税务的影响,在此基础上提出相应的应对策略。

【关键词】税收  大数据  挑战瓶颈  对策建议  应用前景

 

一、引言

互联网快速发展促使大数据的应用和技术出现,谷歌是大数据应用的始作者,于2000 年前后率先建立了大型索引库,索引库容量约有十亿网页,确保搜索服务呈现精确性,让搜索互联网的效率成倍提升。谷歌提出了一套以分布式为特征的全新技术体系[1],采取非结构化数据处理解决搜索引擎面对海量数据存储问题,被公认为是大数据技术的源头。谷歌的创新,引发的电子商务、智能推荐等借鉴应用,随后拥有大量数据的金融、电信等行业也开始加入应用尝试,均获取良好的应用成效。2011 年,随着业界不断在场景使用方面加大力度,不断扩展谷歌大数据技术体系,同时又有知名机构麦肯锡、世界经济论坛对数据驱动创新作出实践总结,一股大数据热潮在世界各地在蓬勃兴起了。2012年,《大数据的研究和发展计划》(Big Data Research and Development Initiative)在美国颁布,大数据应用成为了美国的国家战略。我国对此也相当重视,2015年,国务院正式印发《促进大数据发展行动纲要》[2],从国家层面推动对大数据的发展。响应国务院号召国家税务总局积极探索大数据技术应用。实施了对税改产生了重大影响金税三期工程[3]。概括金税三期工程的内容就是:一个平台、两级处理、三个覆盖、四个系统。可以说金税三期工程将大数据创新应用于税收工作中,极大地改善税务格局,取得了显著成效,然而,我国税收的整体数据技术水平仍处于大数据时代的初始阶段。距离大数据时代尚有一段很长的距离,本文分析大数据在我国税收应用中存在的问题,并提出思考和建议。

二、大数据时代赋予税务变革内涵

随着大数据的技术应用深化,覆盖率的不断提高,大数据产业发展加速。税收工作也不例外,大数据同样为税收工作带来方法性变革,通过大数据的强力支撑,传统税收被大数据时代赋予了变革内涵。

(一)大数据彻底改变传统税收工作模式

传统的税收工作对象是纳税人、涉税单位及相关的涉税业务,还有税务机关内部干部和业务等,大数据时代的到来,扩展税收工作面,实现全覆盖。大数据是全领域数据,无论是历史数据,还是实时数据,甚至是第三方数据,应有尽有,这就为税务部门对各行各业开展跨时间跨区域综合收集处理分析涉税事项,提供了强有力的数据支持,再者通过强大的分析软件将结构性数据、非结构性数据处理分析,体量大种类繁多的涉税数据变得整齐划一,精准到位,大大节省税务人员的时间精力和降低劳动成本,不仅转变了税收工作的模式,提高税务人力资源效率,更多的时间将用于集中思维和工作方法的改进措施,更多的人力从日常征管转入到评估或稽查,投入税收工作的薄弱环节,促进税收向现代化发展的步伐。

(二)大数据技术促进各项工作效率提高

传统税收工作业务中,目前由于业务数据反馈难以做到实时,造成纳税申报和税务稽查等涉税工作存在的滞后性,随着大数据挖掘和分析技术的发展,涉税工作的滞后性问题将迎刃而解,数据传输信息获取加速,税收工作效率将大大提高。虽然我国的金税工程建设为税务部门积累了海量的涉税数据,但不完善的征管体制、不规范的采集标准、不先进的应用技术等因素的制约,大量涉税数据仍处于碎片式分布和沉睡状态,随着大数据时代的到来,税务机关可搭建数据仓库平台,运用先进的技术手段,唤醒沉睡涉税数据,挖掘数据的有用价值,将静态数据变为动态信息,为涉税数据的进一步分析处理提供支撑。加快我国税务向智能税务智慧税务方向发展。

(三)大数据有效监控税源减少税收流失

大数据时代的到来,各组织和部门之间的边界将逐步被弱化,外部数据的来源会愈加丰富,有利于大数据分析平台和涉税数据共享交换机制的建立,真正实现税务、海关、工商、银行、公安等部门之间,乃至淘宝、京东等第三方涉税信息部门之间高效的数据交换和共享,以便于税务部门更高质量地搜集和整理涉税数据,更有效地对涉税信息进行分析和处理,更直观地了解纳税人的生产经营情况和税负变化,从而有利于税务部门深度挖掘涉税信息的价值,获取税收风险点,评估其风险等级,科学制定税收风险管理策略,更好地监控重点税源,有效杜绝偷逃税行为,减少税收流失。

三、税务大数据发展面临的问题

(一)数据源不全面,质量有缺失

目前,税收数据的来源相对单一,通常只来自纳税人的申报、税务当局的日常管理和重点检查,向第三方涉税数据获取上缺乏主动性,并且只是将那些碎片化的涉税数据搜集过来。二是涉税数据的收集方法相对较差。落后的采集方式,主要是利用储存设施在有关部门进行提取,无法满足大数据时代税收管理效率的要求,从数据的质量来看也是很大程度上降低了。三是数据标准化不到位。数据初次录入存在区域不同和部门不同,进而影响传输和分析,二次处理造成出现错误;四是税收数据的质量有一些不一致和不准确之处。数据质量管理、定期数据评估系统和问责核查机制的缺失,不利于及时发现和有效纠正数据错误。数据质量取决于数据的准确性、便捷性和处理成本高低。

(二)数据开放较低,获取难度大

外部门数据公开性弱,第三方涉税数据获取难度大。为实现政府各部门间的信息渠道畅通,确保部门间数据共享和交换通过统一平台进行,政府部门实施信息系统工程,畅通部门数据共享,如实施了税务的金税工程、海关的金关工程、财政的金财工程等等,其它字头工程也还在建设之中。以上字头工程数据共享和使用程度对税收大数据建设产生重大影响。但对获取第三方数据比字头工程难度更大,银行、证券公司、保险公司等金融机构掌握的第三方数据,各金融机构的数据出于保密,一般是不会共享数据的,数据获取难度很大。税务部门现在有需求数据时,一般是个案处理的方式,这种数据收集方式阻挡了税务大数据建设步伐。

政府部门间的数据共享还未完全实现。现代化税收工作需要获取来自工商、财政、教育、司法、执法等其他部门的相关信息。为实现政府各部门间的信息渠道畅通,我国开展了金税、金关、金财等政府部门的信息系统工程,目的是通过统一平台进行数据间数据共享和交换,但部分工程还处于建设中,尚需完善。此外,共享数据的范围边界和使用规则还未形成统一的标准规范。

(三)数据孤岛众多,整合难度大

税务信息化建设存在不少问题。一是缺乏统一规划,以致信息化建设出现重复、盲目的问题。表现在系统多而不精,如税控系统有增值税防伪税控系统、税控收款机系统等、单功能系统有车购税系统、督查内审系统等。多系统存在造成了信息孤岛,加大了数据整合难度。金税三期目前实现了国地税通用、全国税务数据总局大集中,但省际数据之间不相通,只能通过总局间接获取,影响了数据整合和效率提升。这还不考虑由各在自行建立的尚未在全国大集中的数据,这更加大数据的整合难度。未在全国大集中的数据产生了许许多多不相信息孤岛。 整合不相通信息孤岛目前是税务大数据发展面临和迫切解决的首要问题。

(四)数据分析单一,处理能力弱

表现在:一是大数据处理技术掌握不足,尽管现阶段各地税务机关已经搭建了许多涉税数据综合分析平台,但仍局限于部分数据的纵向对比,并未深挖成因、追根溯源,分析模式单一,分析自动化程度不高,结果依然不够准确。二是数据实时分析能力不足,目前,税务机关数据不是采取流式处理方式,却以批量处理方式居多,数据实时处理能力与大数据要求还是相距比较远的,有待今后为断加强。三是基本上没有建立数据模型。在税务工作中限于技术限制大数据模型总的说还是没有建立起来。更高层次的税收数据模型如对接宏观经济预测等还在襁褓中。此外在方法上都是较低层级的,目前数据处理用的大都是如均值、方差和回归等。

(五)法律法规缺乏,产生盲区多

现行的税收法律法规是基于传统的产业、产品及交易模式制定的,无法适应互联网 +下产生的新兴业态,产生税收管理盲区,使电子商务尤其是跨境电商等业务长期游离于税收监管之外。《税收征管法》尽管虽也明确要求政府部门应信息共享,但由于缺乏具体的实施办法,很大程度上影响了税务数据采集的质量。

(六)数据保护欠缺,安全有隐患

税务机关通过互联网技术搜集到的涉税数据,一般会涉及纳税人的商业秘密、个人隐私、会计账务、资金流水等,虽然目前对税务机关内外网进行了人工隔离,但计算机病毒和黑客无处不在,不能够保证涉税数据存储环境的绝对安全。一旦这些涉税数据遭受病毒、黑客的冲击就会被泄露或删除,给纳税人造成不可估量的经济损失。而且,我国尚未构建完善的数据保护制度体系,网络密码管理和政府信息系统管理制度不健全,难以保障网络信息安全。在电子数据保密制度中,没有明确征纳双方的权利、义务和责任,作为数据提供方,纳税人就不可避免地承担着被黑客袭击和隐私被泄露等风险。为此,要明确是个人数据什么、个人隐私数据是什么,为我国大数据发展确立规范;虚拟世界数据是否有保密和保护的义务,如何界定违法的边界,这在《中华人民共和国保守国家秘密法》中还是空白,有待进一步加以完善。

四、推动税收大数据发展的对策思考

(一)加强宣传提高认识,转化思维推动应用

加强宣传教育,提高税务机关各级领导干部的大数据认识,从传统的小数据思维中解放出来,高度重视税收大数据在转变税收管理方式、提高税收现代化水平上的重要作用,要有开放共享、团结协作的管理思维,需要税务部门与社会多部门进行协同合作,数据互换共享,实现真正意义的以票管税信息管税转变。要有对纳税人参与度高度重视的管理思维。在互联网 +背景下,税务机关与纳税人应建立密切联系,并通过纳税人的反馈,不断推动税收工作的创新与进步。

(二)建立高效公开渠道,提高数据使用效能

数据公开体系是否健全,直接影响大数据分析。提高数据质量,必须数据源上下功夫。信息交互是双方的,扩大税收数据容量的关键让税务数据走出去,从而把更多涉税数据引进来,数据引进来促进税务大数据使用效能提高。建立数据公开体系,当前从二方面入手:一是探索对公开税收数据进行立法保障。借鉴美国税务公开制度,从法律上厘清纳税人信息保护和税收数据公开的边界。二是制定统一数据公开平台。当前税务数据公开各地口径都不相同,这就会带来数据获取的不便,还有的数据范围比较窄小,数据不及时更新等现象,这不能让数据产生效能。因此,要为社会各界有一个权威、快捷、实用性高的税收数据获取渠道,建议在国家税务总局官网统一设立一个税收数据模块,提供税务数据走出去,方便社会获取税收数据的便利。

(三)推动数据标准建设,促进数据全面生成

数据分析结果要真正符合工作实际,务必从统一数据标准入手,不断提高数据质量、份量,减少数据分析成本,推动数据向规范化建设。首先,应制定数据标准规范。从便于数据元管理的角度,通过建立关键数据业务标准规范,统一明确数据的含义和格式,保证数据分类的科学性、准确性。其次,下力加快数据管理流程的优化进程。对数据传输流程改造优化,使数据传输中系统自校能力得到增强。再是强化税务大数据库建设。数据大数据分析成效依赖于税务大数据库数据全面生成。因此,要在全国建立一个统一的数据资源平台,有利于各信息系统的数据的全面整合,确保数据全面生成。完善全国共治平台数据环境建设,充分运用互联网数据先进采集技术网络爬虫工具,获取更完整的跨部门以及互联网等涉税信息。

(四)拓展数据分析方法,优化数据系统架构

不断拓展分析方法,尽快完善分析模型,让挖掘数据范围更广、使用更广。首先,积极创新数据模型,数据模型的建立、推广,实现了预测和风险管理针对性。提升宏观分析服务的能力。其次,丰富分析形式,提升分析价值。借助机器学习方法,运用云计算工具,采用流式处理法计算分析大数据,整合现有资源。利用云计算高可用”“沙箱手段,借力复杂数据分析方法的决策树、随机森林等对大数据进行总体分析,增强处理能力,适应大数据复杂分析需求。再次,提升和强化处理响应的作业速度。要系统架构设计优化,对计算分析的处理、测试的标准等应作出研究和实施的具体步骤,与此同时还要发挥分布式并行处理技术对仓库进行大幅的扩容,彻底减轻数据仓库存放压力。运用人工智能技术[4],有效提高分析应用能力。以税收大数据为基础,以 Hadoop[5]分布式架构为体系,结合人工智能技术可以搭建一个涉税数据智能分析应用平台,实现数据的组织、加工、计算、输出等过程的全自动化,促进税收管理从信息化到智能化的转变。

(五)明确责任落实共享,完善法律强化保障

进一步完善相关法律制度,建议应从国家顶层设计,强化法治保障。首先,适应互联网时代税收管理需要,明确电子身份认证方式、认证的具体内容、违反规定的法律责任等,使电子政务法律法规更加切合税收实际。第二,在法律法规中增加政府信息公开及信息保护等条款。为有效落实信息共享制度,要进一步明确涉税数据安全管理标准、实施配套办法,及惩戒措施;为保障涉税数据有效获取,明确第三方信息报送义务及保障制度。进一步明确保护纳税人相关权利,如隐私权保护等,税务机关的密码保护、数据使用范围、数据的采集应用、数据安全与交换等内容也必须具体的规范。第三,尽快修订《税收征管法》的,对新型经营主体、范围和交易模式作出完善规定,完善电子缴税法律制度,以适应互联网 +背景下针对新业态开展税务管理的需要。

(六)尽快构建安保体系,减少隐患保障安全

一是提升信息安全程度。对纳税人的各类信息采取数字签名、虚拟专用网络(VPN)等安全技术进行加密处理。二是及时更新木马病毒库。隔离内外网,建设税务安全系统和监控系统,税务人员在日常办公过程中遵守信息安全管理制度,注重网络操作规范。三是建立数据管理机制。开展数据质量检查,全程监控数据质量,建立倒查机制强化问责。同时,还要加大硬件、资金的投入,做好网络基础设施建设和应选技术能力过硬、有良好声誉的网络安全软件,构建大数据安保体系,从根源上减少安全隐患。

(七)科学规划培养机制,优化升级人才结构

要大力宣传大数据技术对税收的重要性,使税收工作人员在工作中能用大数据思维去应用大数据技术。加大对大数据技术的培训,提高税务人员熟练掌握应用大数据技术技能。税收大数据的发展,需要大量的大数据应用人才。从现在起应将大数据专业技术人才培训纳入日常工作,从而为税务大数据的应用发展打下坚实的基础。

五、税收领域大数据的应用展望

当前,税务大数据深化应用作为互联网+智慧税务的重要依托,其发展将获得前所未有的强力推动。大数据的技术优势主要表现在:传统分析方法在推断总体时总是依赖于样本,而大数据却由于自身技术特性,突破了这种研究的限制,大大提高了数据分析运用的准确性和代表性。通过税务大数据分析可以优化税收管理服务、助力经济政策调控。如何更多的获取掌握和提取整合大数据,事关税务大数据应用的未来。税务机关的信息化建设因大数据应用发展带来全新的突破,提供更为有力的业务创新手段。在应对税制改革和征管改革的挑战中,大数据技术为税务机关搭建高效的组织体系提供了良好的工具。借鉴美国等国家的先进经验[6],展望未来,我国税收领域大数据应用主要有以下几个方面:

(一)增强管理能力,精准税收服务

一是做好挖掘海量税收数据文章。如何做到对纳税人的涉税风险准确查找、预测和判别风险,使用大数据技术通过对数据的横向对比、历史分析是重要一环。我们可对纳税人进行聚类分析,将纳税人开票申报及公开数据汇聚起来,就能绘出纳税人轮廓和需求,从而让后续服务不再盲目了。二是做好利用数据处理优势文章。确保税收服务时效性的提高,应充分发挥好大数据的数据处理优势。比如要提高税务前台人工处理能力,就可以紧紧抓住历史数据这个基础,通过神经网络技术对历史数据分析处理,以历史数据预测当期数据,对当前风险作出快速的识别、监控和预警,形成后台数据,替代低效率的前台人工处理,增强前台处理能力,前台服务的能力和时效因此得以提高。三是做好数据个性化需求服务文章。要为纳税人的税收服务实现个性化、精准化,必须借力大数据技术,从数据分析中找出纳税人的需求中个性化。不少商贸业纳税人存在虚开虚抵等税收风险,税务部门就通过对纳税人各个时期的经营情况数据、税务申报数据和往来取得各类发票的数据综合处理,查找发现其潜在的来自问题企业的发票抵扣风险,提前向商贸业纳税人作出提示提醒,如此税务部门为其提供的税收服务一定是具有个性化、精准化的。

(二)提高执行能力,搭建高效组织

目前我国税收数据环境欠佳,各级税务机构的人力资源和工作职责缺乏科学的安排,严重影响执行能力和组织体系高效运行。为此今后可依托大数据技术的优势,对组织体系和人力资源适当优化。总局或省局方面,对原由处理基层的可数据化事项、日常数据管理等事项改由总局或省局承担,对无法数据化处理事项仍由市及以下税务机关负责执行,毕竟有的数据化处理需当面沟通的,如由总局或省局承担不现实。进一步增强总局或省局的风险识别和评估职能,让市及以下税务机关风险识别和评估职能减弱,有利于实现优化组织体系,推动组织结构扁平化。提高组织的执行能力,利用大数据服务绩效管理。选取绩效管理实时性指标提高时效,在大数据技术支持下是可以做到实时评价的;还可将各指标占总体的权重的决定权交由大数据技术,运用模糊、层次等技术分析调整权重,绩效评价比固定的指标权重评价更加有符合实际且评价更加准确和客观。

(三)增强经济判,科学制定政策

借助于大数据技术,决策层能实时针对纳税人的反应,提前开展政策效果评估,提高政策精准程度,以此提高政策制定的科学化水平。税制改革影响深远,每次改革前都必须作出缜密研究和判断。相对于大数据预测分析的对象是整个群体,贴近实际,预测参考价值高,也是更为准确。大数据信息时效性强、利用大数据技术灵敏度高,收集、挖掘和分析大数据,变经验数据,强化综合归纳,使得决策层形成对复杂变化趋势完整的认识,确保分析过程高效有序。更加科学、前瞻地制定相关税收政策和征管措施。

六、结束语

大数据时代为税务信息的存储和整合带来了便利。提高了税务工作效率,加快了我国税务管理的信息化进程,也对税收工作提出了更高的质量要求。税务机关拥有海量的数据资源,大数据在税务领域的应用,目前还处于起步阶段,所谓税务大数据其实就是税务系统内数据 + 税务系统外涉税数据。须知,互联网 + 智慧税务智慧二字是一定要依靠大数据及其应用方能实现的。因此想要真正提升税务管理服务实效,一方面要紧紧依靠大数据技术,借助数据分析的力量,提高税务风险预防与控制效果;另一方面要为断完善法律、强化数据的安全保障,培养大批高端人才,充分发挥出大数据独特的优势,才能有效应对各种挑战,从而推动税务大数据应用迈向新台阶。

 

 

(作者单位:国家税务总局龙岩经济技术开发区税务局

 

 

【参考文献】(略)

 


[1] 即后来陆续公开的分布式文件系统 (GFS,Google File System)、分布式并行计算 (MapReduce) 和分布式数据 (BigTable) 等技术, 以较低的成本实现了之前技术无法达到的规模。

[2] 2015年8月31日国务院发布《促进大数据发展行动纲要》提出从政府大数据、新兴产业大数据、安全保障体系三个方面着手推进大数据领域十大工程建设。此外,《纲要》还提出,要在2017年底前形成跨部门数据资源共享共用格局,在2018年底前建成国家政府数据统一开放平台。

[3] 该系统融合了税收征管变革和技术创新,统一了全国地税征管应用系统版本,搭建了统一的纳税服务平台,实现了全国税收数据大集中。

[4] 人工智能(Artificia lntelligence,AI)是一种研究如何应用计算机的软硬件来模拟人类某些智能行为的基本理论、方法和技术,实质是通过训练海量数据和模拟人脑构建学习模型来挖掘数据更有用的特征,进而实现数据的准确分类或预测。

[5] Hadoop简单来说就是用JAVA写的分布式,处理大数据的框架,也就是分组合并的原则。分组:数据按照算法分成多份,每份存储在从属的主机上并进行计算,主节点负责Hadoop的两个关键功能模块HDFS(高度容错)、Map reduce(映射和化简)的监督。合并:将每个机器上的计算结果合并在一台机器上计算出最终结果,即mapreduce(一种编程模型)算法。

[6] 如美国国内收入局曾经运用数据挖掘技术在海量纳税人数据中发现高收入避税群体,德国、荷兰税务部门运用爬虫技术从互联网上获取纳税人数据来助力税收管理。

上一页:新机构深融合
下一页:我国优化税收营商环境的国际借鉴与思考 【收藏本页】 【打印】 【关闭】
地址:福建省福州市铜盘路30号 邮编:350003
联系电话:0591-87840097 Email:fjswxh@qq.com
技术支持:福州泰讯软件技术服务有限公司  建议使用分辨率为:1024*768
闽ICP备09045903号   闽公网安备 35010202000728号   Powered by SiteServer CMS