logo
  • 安装
  • 开始
  • 教程
  • 用户指南
  • 资源
  • API 参考
  • 发布说明
  • composeml.LabelMaker
    • composeml.LabelMaker.__init__
    • composeml.LabelMaker.search
    • composeml.LabelMaker.set_index
    • composeml.LabelMaker.slice
  • composeml.LabelTimes
    • composeml.LabelTimes.__init__
    • composeml.LabelTimes.apply_lead
    • composeml.LabelTimes.bin
    • composeml.LabelTimes.copy
    • composeml.LabelTimes.describe
    • composeml.LabelTimes.equals
    • composeml.LabelTimes.sample
    • composeml.LabelTimes.select
    • composeml.LabelTimes.threshold
    • composeml.LabelTimes.to_csv
    • composeml.LabelTimes.to_parquet
    • composeml.LabelTimes.to_pickle
  • composeml.label_times.plots.LabelPlots
    • composeml.label_times.plots.LabelPlots.__init__
    • composeml.label_times.plots.LabelPlots.count_by_time
    • composeml.label_times.plots.LabelPlots.distribution

composeml.LabelMaker.search¶

LabelMaker.search(df, num_examples_per_instance, minimum_data=None, maximum_data=None, gap=None, drop_empty=True, verbose=True, *args, **kwargs)[source]¶

搜索数据以计算标签。

参数
  • df (DataFrame) – 用于搜索和提取标签的数据框。

  • num_examples_per_instance (int 或 dict) – 从每个数据框组返回的预期样本数量。可以使用字典进一步指定从每个标签返回的预期样本数量。

  • minimum_data (int 或 str 或 Series) – 开始搜索前所需的数据量。默认为时间索引中的第一个值。该值可以是 datetime 字符串,直接设置第一个截止时间;也可以是 timedelta 字符串,表示第一个截止时间前所需的数据量。该值也可以是整数,表示第一个截止时间前所需的行数。如果是一个 Series,minimum_data 应该是 datetime 字符串、timedelta 字符串或整数值,其索引是唯一的目标组集合。

  • maximum_data (str) – 停止搜索前的最大数据量。默认为时间索引中的最后一个值。

  • gap (str 或 int) – 样本之间的间隔时间。默认值是窗口大小。如果是一个整数,搜索将从最小数据后的第一个事件开始。

  • drop_empty (bool) – 是否删除空切片。默认值为 True。

  • verbose (bool) – 是否显示进度条。默认值为 True。

  • *args – 用于标签函数的定位参数。

  • **kwargs – 用于标签函数的关键字参数。

返回值

计算出的带截止时间的标签。

返回类型

lt (LabelTimes)

上一个

composeml.LabelMaker.__init__

下一个

composeml.LabelMaker.set_index

Alteryx Open Source
GitHub Twitter

Copyright