Spring aware接口的作用是什么
402
2022-10-05
数据项目在AI生命周期里的七阶段(大数据应用的生命周期主要包括哪几个阶段?)
AI是当前科技领域中的热门话题,时至今日,企业数据资产及其价值已成为企业经营中的明星业务,无论是业务扩展还是相关数据安全,如何让AI技术在企业数据相关项目中应用最大化则成为当下企业和相关人员兴趣驱动的焦点。
首先,我们要强调一下AI的一个特质:AI不是IT,AI与传统软件在使用也大相径庭,究其根源,在于传统软件往往是确定性的技术,而AI是一项不确定性的、需要考虑概率统计的技术。
我们再来看,在数据中利用AI算法发现价值的过程是一个极具挑战且耗时巨大的工作。虽然一个非技术背景的负责人或执行者在相关项目执行中不必掌握类似如何清理数据、编写Python或是针对算法参数进行优化调整等这样的技术细节,但他们必须清晰理解整个项目过程在各个阶段设定的定义和目标,只有这样他们才能帮助相关业务专家和数据科学家在这个充满实验性质的过程中发现企业业务数据中的最大价值。
目前,国外相关研究已经清楚描述了在AI数据下的七个阶段,但因AI技术的不确定和概率统计等特性,同时企业数据也需经历一个认知过程,因此在数据项目中使用AI技术,再按这七个阶段来执行时往往还需要遵循这样的规律(参照下图):
项目在各个阶段循环速度很快,而且阶段之间经常会有迭代循环操作,为了一个中间结果经常会从一个未完成阶段直接跳到下一阶段,如图所示,项目周期中的步骤1和2(业务理解和数据理解)以及步骤4和5(数据预处理和建模)经常是同时进行而不是串行发生。
下面我们详细分解一下AI数据项目周期中的七个阶段任务:
一、业务理解阶段
目标
确定该数据AI项目的最终业务目标,以及为该项目分配的资源。寻找诸如以下问题的答案:“项目追求的最终结果是什么?”、“AI真的是完成该工作的正确工具吗?”和“这个潜在的AI项目中可衡量的战略价值到底是什么?”等。
挑战
为企业寻找合理且可到达的目标机会,尽量避免因高估AI的能力而好高骛远,企业需要有清晰认识,预想此类项目具有长时的迭代周期以及需为此发挥各种途径建立相关技能和竞争力,这样才能真正将AI技术融入企业日常业务中。
参与角色
高层决策者
首席数据科学家
项目经理
相关业务专家
二、数据理解阶段
目标
确定数据的可访问性和潜在价值,寻找诸如以下问题的答案:“可以利用现有的数据资产就能实现我们定义的业务目标吗?”,或者“使用这些数据是否存在潜在挑战,或者是否有机会以新的方式使用这些数据来实现期望的业务成果?”等。
挑战
从数据中获取最高价值,为了达到这个目的需要相关业务专家和数据科学家一起研究数据,以确定诸如访问数据的方式、如何优化数据以及哪些相关功能可能对最终业务目标具有最高价值。
参与角色
首席数据科学家
项目经理
相关业务专家
三、评估项目资源需求阶段
目标
评估和确定项目成功进行所要求的资源,这个工作可能包括额外的预算、对人员的专门培训、要求相关业务专家加入项目团队、或者需要访问新的数据系统。
挑战
让高层决策者清晰明白实际落地的AI项目存在不可避免的高复杂性和不断变化的需求(尤其是对于那些以前没有类似数据项目的企业的决策者)。
参与角色
高层决策者
首席数据科学家
项目经理
相关业务专家
四、数据预处理阶段
目标
访问、清理和规范数据是数据分析工作成功的关键前提。数据分析团队从该过程中确定与可提取数据的相关特征,以定义在给定可数据源上项目的预期及可行性。
挑战
数据科学家如何与决策者和业务专家讲清楚数据项目的困难/挑战和相关成本,这些挑战和成本通常是巨大的(尤其是在比较传统、之前几乎没有类似数据项目的企业看来)。如果在该阶段得出可以输入的数据源无论从数量还是质量都不能满足项目需求的结论,则一定要确定该项目不可行。
参与角色
高层决策者
首席数据科学家
数据分析处理团队
相关业务专家
五、建模阶段
目标
在AI模型的数据输入和数据输出之间建立关联关系,对相关数据和算法进行迭代优化以达到项目预期的业务目标。
挑战
核心工作是在数据处理,数据理解和业务理解之间不停循环迭代与优化模型,这里的关键是需要相关业务专家为AI模型的假设和之后的模型训练过程提供精准的建议。
参与角色
首席数据科学家
数据分析处理团队
相关业务专家
项目经理
六、评估阶段
目标
确定我们的数据资产和产生的AI模型是否满足项目设定的预期,这也经常需要在项目周期阶段1、2、3、4或5之间多次反复循环,根据上次结果和预期之间的差距,优化输入数据源、模型及相关参数进行迭代工作。
挑战
因为数据相关项目的衡量标准很难清晰量化,评估阶段是一个巨大挑战,为了确保各阶段能够顺利执行,让高层决策者和相关业务专家积极参与,制定出合理的评估标准并达到预期效果是关键,这样才能更有信心进入项目最终的部署实施阶段。
参与角色
高层决策者
首席数据科学家
项目经理
相关业务专家
七、部署阶段
目标
将AI模型及相关应用程序成功集成到企业现有业务流程中,并以业务效果为最终衡量标准。
挑战
培训企业业务人员高效使用新的AI应用,这是一个不间断维护并优化模型的持续过程以适应业务的不断变化。
参与角色
首席数据科学家
数据分析处理团队
项目经理
最后,需要再强调一下AI数据项目周期中的步骤可以按以上七个阶段顺序进行思考设计,但是在实操项目的部署实施中并不总是严格遵循这样的串行顺序。例如,在数据预处理的阶段,团队可能会发现新问题而采取“退一步”以了解更深刻相关业务,这样就提出了额外的资源需求(譬如密集且及时清理的数据工作,并由此引出更多的人员、时间和其他资源需求);同样,在评估阶段,为了验证结果或者根据项目实际情况,极大可能会在真正部署解决方案之前返回到数据理解等阶段。
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。
发表评论
暂时没有评论,来抢沙发吧~