什么是 Compose?



_images/compose.png

Compose 是一个用于自动化预测工程的机器学习工具。它允许你构建预测问题并为监督学习生成标签。终端用户通过编写一个*标签函数*来定义关注的结果,然后运行搜索来自动从历史数据中提取训练样本。其结果随后提供给 Featuretools 用于自动化特征工程,并进一步提供给 EvalML 用于自动化机器学习。应用机器学习工程师的工作流程由此变为


_images/workflow.png

通过自动化机器学习流程的早期阶段,我们的终端用户可以轻松定义并解决任务。

主要概念

预测问题通过使用*标签生成器*和*标签函数*来构建。标签生成器沿着时间索引自动提取数据以生成标签。该过程首先在满足最小数据量后设置第一个截止时间。随后,使用*间隔*来分隔后续的截止时间。从每个截止时间开始,一个窗口确定要传递给标签函数的数据量,这也被称为*数据切片*。

_images/label-maker.svg

标签函数随后将提取的数据切片转换为标签。

_images/labeling-function.svg

当标签函数返回连续值时,可以使用标签转换进一步将标签处理为离散值。