数智化时代,产学研是怎样帮助企业的?(3)
时间:2023-03-05 00:22 来源:网络整理 作者:默认发布 点击:次
第二步是我们要用什么东西来预测采用的数据,在人工智能时代,各个国家的监管也越来越严格,比如数据隐私问题,就需要规范人工智能算法的使用。 那么预测模型构建的核心三要素,包括数据、模型、预测标准。 据此,我们从这核心的三要素中,提出了我们的创新,直接从财务报表中提取原始财务数据作为欺诈预测的指标,依托现有的会计理论来挑选原始数据指标,模型方面也做了创新。做出了一个比较强大的算法叫Ensemble learning(组合算法)。 接着,我再和大家说一下机器学习训练的例子,下图的时间线很重要,因为传统的机器学习方法,是没有时间的概念的,你给我一组数据,然后我分开做好两份,拿一部分做训练,另一部分来做预测。 此时没有时间的概念,但是在我们商科里,很多应用是有时间线的,不能拿过去的数据来预测过去,财务造假不能拿100年以后的数据来预测100年以前,这会本末倒置。 因此时间线非常重要。接着我们要考虑如何训练? 比如一些财务造假的问题,可能要花时间才发现,或者有些数据需要时间做准备。比如我们用1991年到2001年的数据做训练。 训练好一个模型以后,去预测2003年这个年度有多少公司是有财务造假的问题,这是训练的一个方法。 四、数据越多越好吗? 原材料并不是越多越好,现在机器很厉害,因此我们发觉,在算法里面越多数据反而越坏。 在商科里面很多数据其实不是大数据,就像我用的也不是大数据,而是财务数据。 在商业场景中其实很多应用都是中小型数据,企业在做机器学习模型时候,可以借助理论指导,精心挑选适合企业的小部分原始财务数据,然后将这些数据与强大的机器学习方法融合,就有可能产生更强大的欺诈预测模型。 同时,科学的评价标准便于机器学习模型的落地执行。 我给大家举的这个机器学习的案例给了我们几点启示: 首先是把管理问题转化成机器学习的问题,这个转换很重要,因为并不是所有的管理问题直接能转换成机器学习的问题,企业需要做一个转型。 第二,理论很重要,我刚才也和大家提到管理理论对模型构建的重要性。 第三,交叉学科,我们这个课题是交叉学科的经济,离开两方中的任何一方,这个项目没法做成,说明了好的机器学习模型构建需要交叉学科团队的紧密合作。 第四是机器学习模型构建需要创新能力,设计出来马上可以用,但你能创造出来,那就不容易。 接着,我们还要看数据质量,好的机器学习模型是需要高质量的数据的。 最后一点我要强调的就是,机器学习不是万能的,需要不断迭代更新。 不是说把模型交付给你,就永远可以用,需要不断更新迭代,不断创新。因为场景在不断演变。 对于很多企业来讲,这个压力是很大的。大家可以看到在智能管理时代我们的玩法跟传统的企业家的玩法是很不一样的,这就像我们进入了无人区,大家都在摸索。 我们学术界在摸索,企业界更是在摸索。在摸索这个过程中很重要的东西是创新及研发。 五、大数据时代产学研合作的机遇及做法 那具体怎么做呢?基于理论。 数据管理对企业来讲是一个核心要素,在做算法之前首先积累数据,用数据去管理数据的标准化,管理数据,还要清理数据,可能占了整个工作的80%,最后20%的时间是在做算法。 要是有很多脏的,坏的数据的话,就没法做了。 第二,谁来做算法? 做算法的都是大数据专家这个范围,比如我们那篇文章的合作伙伴,算法专家都是计算机工程博士毕业,企业需要考虑能请到这样的人吗? 爱因斯坦的脑子,再加上巴菲特的投资的敏感度,把他们做一个合成品,这是我对大数据专家的要求。 我的那篇文章其实就是两者的结合:尖端的大数据专家、科学家及计算机的科班生,加上商科,对管理理解深刻,两个团队融合在一块才能做成这件事。 但是我们可以看到,能找到这两类都特别精通的人还是比较难的,所以我们要考虑未来的发展模式是什么? 只有通过合作共赢的模式,才是必然的路,那对企业是这样,在商业中呢?其实还有一类人叫商业转化人士。 (责任编辑:admin) |



