2024年11月PaddleX下载-飞桨全流程开发工具 v1.1.4

 更新时间:2024-11-15

  ⑴PaddleX又叫飞桨全流程开发工具,是一款集飞桨核心框架模型库以及多种工具与一身的流程开发软件,该软件功能丰富齐全且简单实用,拥有完善的API开发架构,用户可以对软件进行简单便捷的流程编程,该软件多种组件和多种编辑工具,拥有多种丰富的学习开发所需的全部功能,可以帮助用户进行简单便捷的流程开发和学习;PaddleX这款飞桨全流程开发工具界面干净简洁简单易用,可为用户提供简明易懂的Python

  ⑵API,同时该软件可以进行项目创建,可以将本地文件导入软件进行鲁丽和编辑,同时可以下载各种不同的样例进行使用,非常方便实用。

  ⑶PaddleX GUI覆盖深度学习模型开发必经的 数据处理 超参配置 模型训练及优化 模型发布

  ⑷全流程,无需开发一行代码,即可得到高性深度学习推理模型。

  ⑸详细的数据结构说明,并提供 数据标签自动校验 。支持 可视化数据预览 数据分布图表展示 一键数据集切分 等实用功能

  ⑹集成飞桨团队长时间产业实践经验,根据用户选择的模型类别骨架网络等,提供多种针对性优化的 预训练模型 ,并 提供推荐超参配置 ,可

  ⑺一键开启多种优化策略

  ⑻集成可视化分析工具:VisualDL , 以线性图表的形式展示alr等关键参数在训练过程中的变化趋势。提供 混淆矩阵

  ⑼等实用方法,帮助快速定位问题,加速调参。模型评估报告一键导出,方便项目复盘分析。

  ⑽一键启动模型裁剪量化,在不同阶段为开发者提供模型优化的策略,满足不同环境对模型性能的需求。

  ⑾可对历史训练模型进行保存及管理,未进行裁剪的模型可以保存为预训练模型,在后续任务中使用。

  ⑿客户端直接展示模型预测效果,无需上线即可进行效果评估

  ⒀点选式选择模型发布平台格式,一键导出预测模型,并匹配完善的模型预测部署说明文档,贴心助力产业端到端项目落地

  ⒁针对数据准备模型训练模型调优多端部署的深度学习全流程应用

  ⒂简明易懂的Python API,完全开源开放,易于二次开发和二次集成

  ⒃融合产业实践经验

  ⒄融合飞桨产业落地经验,精选高质量的视觉模型方案,并开放实际的案例教学

  ⒅全流程开发文档说明及技术服务。多种方式与技术团队直接进行交流

  ⒆完成软件安装双击软件即可启动软件进入软件准备界面

  ⒇点击立即使用按钮即可进入软件初始化操作界面进行工作空间设置

  ⒈进入软件流程开发工具操作界面,该界面可以进行项目创建

  ⒉点击新建项目按钮弹出项目弹框,该弹框可以进行项目名称任务类型等编辑设置

  ⒊完成项目创建后可以对数据进行选择,可以对数据进行配置

  ⒋点击选择存储路径和创建信息类型,最后点击渠道导入按钮即可将项目文件导入软件

  ⒌点击软件右上角的设置按钮弹出软件设置弹框,该弹框可以对用户偏好进行设置

  ⒍点击下载样例工程弹出选择实例项目弹框,该弹框亏下载样例工程

  ⒎第一步: 准备数据

  ⒏在开始模型训练前,您需要根据不同的任务类型,将数据标注为相应的格式。目前PaddleX支持【图像分类】【目标检测】【语义分割】【实例分割】四种任务类型。开发者可以参考PaddleX使用文档中的.数据准备-数据标注来进行数据标注和转换工作。

  ⒐如若开发者自行准备数据,请注意数据格式与PaddleX支持四种数据格式是否一致。

  ⒑第二步:导入的据集

  ⒒①数据标注完成后,您需要根据不同的任务,将数据和标注文件,按照客户端提示更名并保存到正确的文件中。

  ⒓②在客户端新建数据集,选择与数据集匹配的任务类型,并选择数据集对应的路径,将数据集导入。

  ⒔③选定导入数据集后,客户端会自动校验数据及标注文件是否合规,校验成功后,您可根据实际需求,将数据集按比例划分为训练集验证集测试集。

  ⒕④您可在「数据分析」模块按规则预览您标注的数据集,双击单张图片可放大查看。

  ⒖创建项目和任务第一步:创建项目

  ⒗① 在完成数据导入后,您可以点击「新建项目」创建一个项目。

  ⒘② 您可根据实际任务需求选择项目的任务类型,需要注意项目所采用的数据集也带有任务类型属性,两者需要进行匹配。

  ⒙第二步:项目开发

  ⒚① 数据选择:项目创建完成后,您需要选择已载入客户端并校验后的数据集,并点击下一步,进入参数配置页面。

  ⒛② 参数配置:主要分为模型参数训练参数优化策略三部分。您可根据实际需求选择模型结构骨架网络及对应的训练参数优化策略,使得任务效果最佳。

  ①任务模型训练参数配置完成后,点击启动训练,模型开始训练并进行效果评估。

  ②训练可视化:在训练过程中,您可通过VisualDL查看模型训练过程参数变化日志详情,及当前最优的训练集和验证集训练指标。模型在训练过程中通过点击”中止训练”随时中止训练过程。

  ③模型训练结束后,可选择进入『模型剪裁分析』或者直接进入『模型评估』。

  ④模型训练是最容易出错的步骤,经常遇到的原因为电脑无法联网下载预训练模型显存不够。训练检测模型实例分割模型对于显存要求较高,建议用户通过在Windows/Mac/Ubuntu的命令行终端(Windows的Cmd命令终端执行nvidia-smi命令查看显存情况,请不要使用系统自带的任务管理器查看。

  ⑤任务模型裁剪训练此步骤可选,模型裁剪训练相对比普通的任务模型训练,需要消耗更多的时间,需要在正常任务模型训练的基础上,增加『模型裁剪分类』和『模型裁剪训练』两个步骤。

  ⑥裁剪过程将对模型各卷积层的敏感度信息进行分析,根据各参数对模型效果的影响进行不同比例的裁剪,再进行精调训练获得最终裁剪后的模型。裁剪训练后的模型体积,计算量都会减少,并且可以提升模型在低性能设备的预测速度,如移动端,边缘设备,CPU。

  ⑦在可视化客户端上,用户训练好模型后,在训练界面,

  ⑧首先,点击『模型裁剪分析』,此过程将会消耗较长的时间

  ⑨接着,点击『开始模型裁剪训练』,客户端会创建一个新的任务,无需修改参数,直接再启动训练即可

  ⑩模型效果评估在模型评估页面,您可查看训练后的模型效果。评估方法包括混淆矩阵精度召回率等。

  Ⅰ您还可以选择『数据集切分』时留出的『测试数据集』或从本地文件夹中导入一张/多张图片,将训练后的模型进行测试。根据测试结果,您可决定是否将训练完成的模型保存为预训练模型并进入模型发布页面,或返回先前步骤调整参数配置重新进行训练。

  Ⅱ模型发布当模型效果满意后,您可根据实际的生产环境需求,选择将模型发布为需要的版本。

  Ⅲ如若要部署到移动端/边缘设备,对于部分支持量化的模型,还可以根据需求选择是否量化。量化可以压缩模型体积,提升预测速度

  Ⅳ为什么我的数据集没办法切分?

  Ⅴ如果您的数据集已经被一个或多个项目引用,数据集将无法切分,您可以额外新建一个数据集,并引用同一批数据,再选择不同的切分比例。

  Ⅵ任务和项目的区别是什么?

  Ⅶ一个项目可以包含多条任务,一个项目拥有唯一的数据集,但采用不同的参数配置启动训练会创建多条任务,方便您对比采用不同参数配置的训练效果,并管理多个任务。

  Ⅷ为什么训练速度这么慢?

  ⅨPaddleX完全采用您本地的硬件进行计算,深度学习任务确实对算力的要求比较高,为了使您能快速体验应用PaddleX进行开发,我们适配了CPU硬件,但强烈建议您使用GPU以提升训练速度和开发体验。

  Ⅹ我可以在服务器或云平台上部署PaddleX么?

  ㈠当前PaddleX 可视化前端是一个适配本地单机安装的Client,无法在服务器上直接进行部署,您可以直接使用PaddleX

  ㈡Core后端技术内核,或采用飞桨核心框架进行服务器上的部署。如果您希望使用公有算力,强烈建议您尝试飞桨产品系列中的 EasyDL 或 AI

  ㈢Studio进行开发。

  ㈣为什么我的安装总是报错?

  ㈤PaddleX的安装包中打包了PaddlePaddle全流程开发所需的所有依赖,理论上不需要您额外安装CUDA等ToolKit (如使用NVIDIA

  ㈥GPU), 但对操作系统版本处理器架构驱动版本等有一定要求,如安装发生错误,建议您先检查开发环境是否与PaddleX推荐环境匹配。

  ㈦Version ..

  ㈧修复意外中止后项目信息丢失问题

  ㈨修复意外中止后,后台进程仍未结束问题

  ㈩训练过程用户可以查阅错误日志

  数据加载出错提示导致错误的图片文件

  VisualDL后台进程改为存活时间分钟

您可能感兴趣的文章:

相关文章