自动驾驶生成式大模型即将上线（机器学习的自动驾驶仪）

小君 2023-05-16 15:14:10 657

自动驾驶生成式大模型即将上线（机器学习的自动驾驶仪）事实上，低层次任务的某些方面可能会被计算机化，这会导致失去某些工作，降低总体收入。不过，请注意，AutoML 的主要目标是使科学家摆脱繁琐费时的工作。数据学家运用工程学、统计学和人类学的专业知识，从业务角度理解数据，并提供可靠的洞察力和预测。与此同时，机器学习算法有助于组织模式的识别。但是，它们在数据驱动过程中的功能局限于对未来事件产生预测。它们还不能完全了解具体数据对公司及其关系的意义。传统的机器学习需要以下步骤：使用 AutoML 就可以减少这些步骤。AutoML 侧重于第一阶段的数据采集和最后一步的预测。正如名称所示，所有其他的中间阶段都是计算机化的。它使用组合值作为输入，并生成预测值作为输出。其生成的优化模型可用于预测。在我们讨论自动化是否会扼杀工作机会之前，有必要理解数据科学和机器学习的区别。

AutoML 是一种术语，描述了在真实世界场景中执行机器学习的自动化端到端过程。这是一种人工智能驱动的系统，其重点是自动地分析数据，并以最小的努力提供可操作的洞察力。目的是在重复和耗时的活动中减少数据科学家的负担。换言之，它允许我们把机器学习应用到真实世界的应用中，即使你并不是这方面的专家。

机器学习的目标是利用模型来建立模型表现形式，然后用这些模型来判断新的价值。在训练中，机器学习算法改进了模型，类似于人类幼儿通过监督下的教育和接触的混合学习来习得基本语言的方式。

它是一个将机器学习过程的每个步骤都计算机化的平台，从管理原始数据集到安装一个有用的机器学习模型。

AutoML 的用途

寻找一种适用于数据集的模型：每一种数据集都有多种方法，比如逻辑回归、决策树等等，而确定数据集的最佳策略可能是一个耗时的过程，需要大量的研究和定制。
超参数优化：每一种机器学习技术都包含代表每个变量权重的参数。大多数机器学习模型，除了参数外，还有超参数，通常都包含 dropout 和模型特定的参数，比如随机森林中的树的数量。开发者在训练阶段开始之前确定其值。由于超参数不同于模型参数，训练过程中没有通过数据学习，因此它们通常在训练阶段是恒定的。对超参数的最佳选择可以得到最准确的模型，但是需要有一种策略来决定理想的组合。
特征选择：特征工程是一个确定最佳变量集以及最佳编码的过程，用于训练过程的输入。最燃最好的特征通常依赖于所用的模型，但特征对于模型的构建是必不可少的。另外，采用的特征的数量会影响模型的开发和评分的时间，并有可能减缓整个过程。它用机械化的审查程序来确定哪种特征组合最有效。

AutoML 的重要性