composeml.LabelMaker.slice

LabelMaker.slice(df, num_examples_per_instance, minimum_data=None, maximum_data=None, gap=None, drop_empty=True)[source]

生成目标数据帧的数据切片。

参数
  • df (DataFrame) – 要在其上创建切片的数据帧。

  • num_examples_per_instance (int) – 目标数据帧每个唯一实例的示例数。

  • minimum_data (int or str or Series) – 开始搜索前所需的数据量。默认为时间索引中的第一个值。该值可以是直接设置第一个截止时间的 datetime 字符串,或者表示在第一个截止时间前所需数据量的 timedelta 字符串。该值也可以是表示在第一个截止时间前所需行数的整数。如果为 Series,minimum_data 应为 datetime 字符串、timedelta 字符串或整数值,并以一组唯一的目标组作为相应的索引。

  • maximum_data (str) – 停止搜索前的最大数据量。默认值为索引的最后一个时间。

  • gap (str or int) – 示例之间的时间间隔。默认值为窗口大小。如果为整数,搜索将在最小数据后的第一个事件开始。

  • drop_empty (bool) – 是否丢弃空切片。默认值为 True。

返回

返回一个数据切片生成器。

返回类型

ds (生成器)