composeml.LabelMaker.search¶
- LabelMaker.search(df, num_examples_per_instance, minimum_data=None, maximum_data=None, gap=None, drop_empty=True, verbose=True, *args, **kwargs)[source]¶
搜索数据以计算标签。
- 参数
df (DataFrame) – 用于搜索和提取标签的数据框。
num_examples_per_instance (int 或 dict) – 从每个数据框组返回的预期样本数量。可以使用字典进一步指定从每个标签返回的预期样本数量。
minimum_data (int 或 str 或 Series) – 开始搜索前所需的数据量。默认为时间索引中的第一个值。该值可以是 datetime 字符串,直接设置第一个截止时间;也可以是 timedelta 字符串,表示第一个截止时间前所需的数据量。该值也可以是整数,表示第一个截止时间前所需的行数。如果是一个 Series,minimum_data 应该是 datetime 字符串、timedelta 字符串或整数值,其索引是唯一的目标组集合。
maximum_data (str) – 停止搜索前的最大数据量。默认为时间索引中的最后一个值。
gap (str 或 int) – 样本之间的间隔时间。默认值是窗口大小。如果是一个整数,搜索将从最小数据后的第一个事件开始。
drop_empty (bool) – 是否删除空切片。默认值为 True。
verbose (bool) – 是否显示进度条。默认值为 True。
*args – 用于标签函数的定位参数。
**kwargs – 用于标签函数的关键字参数。
- 返回值
计算出的带截止时间的标签。
- 返回类型
lt (LabelTimes)