同花顺-圈子

请广大用户注意风险,切勿加入站外群组或添加私人微信,如因此造成的任何损失,由您自己承担。
一图文看不懂 MLOps 相关股票解析
0人浏览 2023-04-03 21:25

什么是 MLOps?



MLOps 是通过构建和运行机器学习流水线,目的是为了提高 AI 模型生产质效,推动 AI 从满足基本需求的能用变为满足高效率、高性能的“好用”。



顾名思义,MLOps就是机器学习时代的DevOps。它的主要作用就是连接模型构建团队和业务,运维团队,建立起一个标准化的模型开发,部署与运维流程,使得企业组织能更好的利用机器学习的能力来促进业务增长。

MLOps是一门工程学科,旨在统一 ML 系统开发(dev)和 ML 系统部署(ops),以标准化过程生产高性能模型的持续交付。

ML(机器学习)系统开发生命周期和 MLOps 需求的完整演练

image.png

ML 系统工程和运营及其利益相关者

直到最近,我们所有人都在学习软件开发生命周期 (SDLC) 以及它如何从需求获取→设计→开发→测试→部署→一直到维护。 我们曾经(并且正在)研究软件开发的瀑布模型、迭代模型和敏捷模型。

现在,我们正处于几乎所有其他组织都试图将 AI/ML 纳入其产品的阶段。 构建 ML 系统的这一新要求增加/改革了 SDLC 的一些原则,所以产生了称为 MLOps 的新工程学科。

MLOps — 一个新术语出现了,它正在引起轰动并产生新的工作机会。 MLOps 是 Machine Learning Operations 的缩写,也称为 ModelOps。

image.png

为什么是 MLOps?

要了解 MLOps,我们必须首先了解 ML 系统的生命周期。生命周期涉及数据驱动组织的多个不同团队。

这是 ML 生命周期的非常简化的表示。

Google 的团队一直在对构建基于 ML 的系统所带来的技术挑战进行大量研究。 一篇 NeurIPS 论文表明,开发模型只是整个过程的一小部分。 许多其他流程、配置和工具将被集成到系统中。

为了简化整个系统,我们拥有这种新的机器学习工程文化。 该系统涉及从具有最少技术技能的高级管理人员到数据科学家到 DevOps 和 ML 工程师的每个人。

image.png

MLOps 解决的主要挑战

大规模管理此类系统并非易事,需要解决许多瓶颈。以下是团队提出的主要挑战:


  • 缺乏擅长开发和部署可扩展 Web 应用程序的数据科学家。如今,市场上出现了一种新的 ML 工程师简介,旨在满足这一需求。它是数据科学和 DevOps 交叉点的最佳选择。

  • 在模型中反映不断变化的业务目标——数据不断变化,维护模型的性能标准,确保人工智能治理,存在许多依赖关系。很难跟上持续的模型培训和不断发展的业务目标。

  • 技术和业务团队之间的沟通鸿沟,难以找到共同的协作语言。大多数情况下,这种差距成为大型项目失败的原因。

  • 风险评估——围绕此类 ML/DL 系统的黑盒性质存在很多争论。模型往往会偏离他们最初打算做的事情。评估此类故障的风险/成本是非常重要和细致的步骤。例如,与标记一个无辜的人进行欺诈、阻止他们的帐户和拒绝他们的贷款申请相比,YouTube 上不准确的视频推荐的成本要低得多。


主要阶段——掌握 MLOps 需要什么

在这一点上,我已经深入了解了系统的瓶颈以及 MLOps 如何解决这些瓶颈。您需要瞄准的技能可以从这些挑战中获得。

以下是您需要关注的关键技能:

1. 从业务目标出发构建机器学习问题

机器学习系统开发通常从业务目标或目标开始。它可以是将欺诈交易的百分比降低到 0.5% 以下的简单目标,也可以是构建一个系统来检测皮肤科医生标记的图像中的皮肤癌。

这些目标通常具有特定的性能度量、技术要求、项目预算和 KPI(关键性能指标),它们推动监控已部署模型的过程。

(来自韭研公社APP)

主要阶段——掌握 MLOps 需要什么

在这一点上,我已经深入了解了系统的瓶颈以及 MLOps 如何解决这些瓶颈。您需要瞄准的技能可以从这些挑战中获得。

以下是您需要关注的关键技能:

1. 从业务目标出发构建机器学习问题

机器学习系统开发通常从业务目标或目标开始。它可以是将欺诈交易的百分比降低到 0.5% 以下的简单目标,也可以是构建一个系统来检测皮肤科医生标记的图像中的皮肤癌。

这些目标通常具有特定的性能度量、技术要求、项目预算和 KPI(关键性能指标),它们推动监控已部署模型的过程。


image.png

2.针对问题的架构ML和数据解决方案

在目标被清楚地转化为机器学习问题之后。下一步是开始搜索合适的输入数据以及要针对此类数据尝试的模型类型。

搜索数据是最艰巨的任务之一。这是一个包含多项任务的过程:

您需要寻找任何可用的相关数据集,

检查数据及其来源的可信度。

数据源是否符合 GDPR 等法规?

如何使数据集可访问?

源的类型是什么——静态(文件)或实时流(传感器)?

要使用多少个源?

一旦模型部署在生产环境中,如何构建一个可以驱动训练和优化的数据管道?

要使用哪些云服务?

3. 数据准备和处理——数据工程的一部分。

数据准备包括特征工程、清理(格式化、检查异常值、插补、重新平衡等)等任务,然后选择有助于输出潜在问题的特征集。

将设计一个完整的管道,然后编码以生成干净且兼容的数据,以提供给模型开发的下一阶段。

部署此类管道的一个重要部分是选择高性能且经济高效的云服务和架构的正确组合。 例如,如果您有大量数据移动和大量数据要存储,您可以考虑使用 AWS S3 和 AWS Glue 构建数据湖。

您可能想要练习构建几种不同类型的管道(批处理与流)并尝试将这些管道部署在云上。

image.png

4. 模型训练和实验——数据科学

准备好数据后,您就可以继续下一步训练 ML 模型。 现在,训练的初始阶段是用一堆不同类型的模型进行迭代。 您将使用准确度、精确度、召回率等多种量化指标缩小到最佳解决方案的范围,您还可以对模型进行定性分析,以解释驱动该模型的数学,或者简单地将模型的可解释性放在首位。

我有这个完整的任务列表,您可以在训练 ML 模型时阅读这些任务:

现在,您将使用不同类型的数据和参数运行大量实验。 数据科学家在训练模型时面临的另一个挑战是再现性。 这可以通过对模型和数据进行版本控制来解决。

您可以将版本控制与参数一起添加到 ML 系统的所有组件(主要是数据和模型)。

现在,通过 DVC 和 CML 等开源工具,这很容易实现。

其他任务包括:

通过为模型训练编写单元测试来测试模型。

根据基线、更简单的模型和跨不同维度检查模型。

使用分布式系统、硬件加速器和可扩展分析来扩展模型训练。

image.png

5. 构建和自动化机器学习管道

构建 ML 管道时应牢记以下任务:

确定系统需求——参数、计算需求、触发器。

选择合适的云架构——混合云或多云。

构建训练和测试管道。

跟踪和审计管道运行。

执行数据验证。

image.png

6. 将模型部署到生产系统

部署 ML 模型主要有两种方式:

静态部署或嵌入式模型是将模型打包成可安装的应用软件然后进行部署。例如,提供批量请求评分的应用程序。

动态部署——模型使用 FastAPI 或 Flask 等 Web 框架进行部署,并作为响应用户请求的 API 端点提供。

在动态部署中,您可以使用不同的方法:

部署在服务器(虚拟机)上

在容器中部署

无服务器部署

模型流——而不是 REST API,所有模型和应用程序代码都在 Apache Spark、Apache Storm 和 Apache Flink 等流处理引擎上注册。

以下是注意事项:

确保满足适当的文档和测试分数。

重新验证模型准确性。

执行可解释性检查。

确保满足所有治理要求。

检查任何数据工件的质量

负载测试——计算资源使用情况。

image.png

7. 监控、优化和维护模型

组织需要密切关注模型在生产中的表现,但要确保良好和公平的治理。 此处的治理意味着采取控制措施,以确保模型向所有受其影响的利益相关者、员工和用户履行其职责。

作为此阶段的一部分,我们需要数据科学家和 DevOps 工程师通过执行以下任务来维护整个系统的生产:

跟踪模型预测的性能下降和业务质量。

设置日志记录策略并建立持续评估指标。

排除系统故障和引入偏差。

在生产中部署的训练和服务管道中调整模型性能。

MLOps落地开花,AI资产沉淀和治理成为实践新风向


随着业界对人工智能研发效率、团队协作、安全保障等需求进一步提升,整个MLOps产业实践呈现出“内涵很明确、落地很困难”的现状。


从技术内涵来看, MLOps的核心和要求已明确,即围绕“一个基础、两个关键、三个提升”,逐步建设从需求、开发、交付到模型运营的全生命周期运营管理机制。


一个基础是指持续交付,通过搭建工厂流水线式的模型生产方式,提高规模化生产效率。



两个关键是指持续训练和持续监控,通过持续训练和持续监控搭建高效闭环的运营管理体系,提高机器学习可观察性,保证模型质量,增加赋能效果。



三个提升是指数据管理、特征管理、模型管理能力的提升。对数据、特征和模型等AI资产加以沉淀、安全管控和风险治理,提升企业级AI治理能力,已成为MLOps新风向。

image.png


MLOps对于AI开发的影响表现在四个方面



1.改进数据管理:在MLOps实践中,数据管理是至关重要的。这包括数据清理、数据预处理、数据增强、数据集版本控制等等。一个好的数据管理策略可以确保模型的稳定性和准确性,并且可以降低模型的风险。



2.加强模型监控:MLOps可以使开发团队更好地监控模型的性能和行为,及时发现并解决问题。这包括模型的预测准确性、模型的预测质量、模型的可解释性等等。


3.提高模型部署效率:MLOps可以使机器学习模型的部署过程更加高效和可靠。它可以实现模型的自动化部署、版本控制和配置管理,从而减少了人为错误和部署失败的风险。



4.加强团队协作:MLOps可以实现团队内部和团队之间的协作,从而加快模型的开发和部署。

image.png

  • 此外,MLOps的市场持续火热,端到端的MLOps一体化工具和细分场景的专项工具都非常火热,端到端工具追求大而全的功能集,专项工具在局部或某些场景下功能和性能较好,例如流水线编排、可观测等工具,未来MLOps相关工具可能会成为AI软件市场的重要赛道。


  • MLOps相关新闻

    又一“火热”概念横空出世!“ML OPs”赋能AI加速,A股参与研发仅这5家

    新题材!人工智能再次火爆,细分MLOPs生产力加速器来了

    人工智能新题材MLOps——人工智能生产力加速器

    人工智能研发运营体系(MLOps)实践指南(2023年)


  • MLOps相关股票及概念解析


  • 启明信息002232  一元布局金股

  • 2023年3月22日公司互动:公司基于云原生的MLOps敏捷AI平台,帮助数据科学家和开发人员快速准备、构建、训练和部署高质量的AI模型;降低AI的成本,以自动化、低代码的方式进行生产和落地,提高生产效率,高效率,低成本的赋能启明各业务线产品和制造业各领域的智能化转型,实现操作、流程、决策的自动化、智能化,帮助企业AI进入工业化阶段。

  • 万达信息300168   一元布局金股

  • 据2023年3月19日互动易回复:万达信息参编的团体标准《人工智能研发运营一体化(Model/MLOps)能力成熟度模型 第一部分:开发管理》(AIIA/P 0008-2022)、《人工智能研发运营一体化(Model/MLOps)能力成熟度模型 第二部分:模型交付》(AIIA/P 0009-2022)已经于2022年正式发布。

  • 星环科技688031  一元布局金股
  • 据公司招股意向书:Sophon MLOps通过统一纳管多源异构的算法框架、模型文件和模型服务,同时通过规范化的集成管理,统一部署大规模机器学习模型,并且提供实时监控模型服务的运行状态,可大幅降低模型管理成本,提升模型使用效率与运营能力,降低模型集成管理成本,控制生产环境风险。

  • 宇信科技300674  一元布局金股

  • 据公司2022年年报:AIOps-学件管理中心是MLOps的一种在运维领域的实践,可以推广到更多的AI领域,并通过该能力实现产品和技术的变现。

  • 科大国创300520  一元布局金股

  • 据2021年年报:国创九章数据智能平台持续做深平台的数据处理、AI开发、AI推理和AI部署能力,打造云边端协同的一站式AI平台,持续深化并行计算、高性能推理等核心技术的应用,以MLOps理念构建AI开发敏捷流水线,赋能行业客户端到端的业务建模。

  • 传音控股688036  一元布局金股

  • 据2022年半年报:公司智慧云平台提高三方服务快速接入和智慧分发能力,完成端侧AI相关的MLOps平台服务建设。

  • 看完老铁您懂了啵,嗯,一目十行没懂?再来一遍

    这次好好学习,下次再炒作第一时间上车,干之,肉之,会之,弄之。

上文不构成投资建议,仅供参考。


一元布局金股

image.png

image.png

image.pngimage.png

image.png

image.png

image.png

image.png


更多
· 推荐阅读
0
1
扫码下载股市教练,随时随地查看更多精彩文章
发 布
所有评论(0
  • 暂时还没有人评论
  • 0
  • TOP
该内容由长城证券投资顾问提供,证书编号:S1070619070001
该观点为投顾个人看法,不代表其所属券商和同花顺平台建议。
观点仅供参考,投资有风险,入市需谨慎!