3行代码建模,操练速度提拔200%?那款时序开源神器PaddleTS太强了!
时序是什么?时序揣测能够为营业带来哪些价值?产物销量揣测、电池剩余寿命揣测……那些高价值场景若何进步揣测准确率?深度进修模子在时序揣测有什么优势?若何觅得一款集前沿高尖时序手艺的产物,为营业所用?
近日,百度飞桨重磅发布了一款开源时序建模算法库——PaddleTS,能够搀扶帮助开发者实现时序数据处置、阐发、建模、揣测全流程,具有更优的利用体验:
超易用:3行代码即可完成时序建模
速度快:模子操练效率比同类产物快2倍
效果好:时序专属的主动建模与集成揣测效果凸起
时间序列是根据时间发作的先后挨次停止摆列的数据点序列,简称时序。时间序列揣测是最常见的时序问题之一,在良多行业都有时序揣测的利用,且凡是时序揣测效果对营业有着严重影响。例如:
零售企业 :准确的揣测产物销量,能够为企业备货、配送、运营战略的造定供给有效根据,显著降本增效;
电网公司:准确的揣测发电量与用电量,能够使电网的调度愈加合理化,发扬更大效能;
造造企业:提早揣测消费设备可能发作的毛病,能够提早预警、维修,降低停工形成的缺失;
新能源车企:实时揣测电池剩余电量、揣测剩余寿命,能够更经济、更合理的利用车辆;
金融范畴:利率、股票、现金流、外汇等走势揣测都对经济产生严重影响。
不只如斯,时间序列揣测还在金融利率揣测、股票颠簸率揣测、现金流揣测等关键场景发扬严重感化。
工业设备反常检测
典范的机器进修算法利用到时间序列揣测中,其优势在于模子利用乖巧、操练简单,但也存在明显的缺点,需要大量的人工工做在特征工程上。近年来,深度进修逐渐在语音、视觉、天然语言理解等范畴得到普遍利用,其算法的优势明显。起首,它能够主动捕获关键特征,不需要依靠统计学常识,不需要复杂的特征工程;其次,它在建模流程与准确率上有着机器进修不成相比的优势;此外,它还具备良多功用优势,如利用乖巧、表达力强、兼容多样性等。
既然深度进修那么优良,怎么为时序场景营业所用呢?PaddleTS供给了一系列先辈的基于深度进修手艺的时序建模算法及相关组件,它功用丰富、简单易用、效果领先,包罗能源、交通、造造等多个行业客户早已利用起来,还不快来尝尝~~
GitHub传送门
加进PaddleTS手艺交换群
2. 查看群通知布告领取福利
功用全面丰富
PaddleTS笼盖时序揣测和时序反常检测两大核心利用场景,针对建模全流程,供给了丰富的功用。既撑持单变量也撑持多变量的时序阐发,同时还具备模子合成、主动建模及丰富的建模东西组件。PaddleTS无论是在功用丰富度上,仍是在集成的时序算法数量上,都超越了市道上典型的开源时序产物。除了根底才能以外,产物还有以下特色功用:
全面的数据类型撑持 :PaddleTS供给的 协变量撑持 功用,撑持汗青看测协变量、将来可知协变量、静态协变量和分类变量等各类协变量数据类型,搀扶帮助开发者有效操纵各类数据足够发扬数据的价值。
支流别致的深度模子:PaddleTS集成了Transformer、 TCN、 VAE、 TS2Vec、N-beats等丰富的深度进修模子,能够很好的捕获复杂时序场景中的多变量动态依靠关系,处理长周期、多变量、小样本等问题,获得更好的模子效果。
丰富的阐发建模东西集:PaddleTS内置了时序特征处置、数据阐发、回测、滚动揣测、主动建模、模子合成等阐发建模过程中十分适用的功用,能够搀扶帮助开发者削减编码数量,提拔开发效率。
简单易用、快速上手
不需要深入的专业布景和复杂的特征工程
3行代码实现时序建模
PaddleTS笼盖了大部门支流深度进修模子,开发者只需将数据根据格局要求灌进数据集,再通过简单的回一化处置即可停止模子操练揣测。相较于传通盘计模子对开发者统计常识的要求,机器进修模子在操练前复杂的特征工程,开发者利用PaddleTS构建深度进修模子愈加快速、简单。
时序建模代码示例
dataset = TSDataset.load_from_dataframe(df, **kwargs)
mlp = MLPRegressor(in_chunk_len = 7 * 24, out_chunk_len = 24)
mlp.fit(dataset)
兼容第三方库,机器进修模子也能高效操纵
PaddleTS默认集成了sklearn、pyod等第三方库,处理了传统机器进修办法不克不及间接用于时序数据,且建模过程复杂等问题。开发者通过几行代码即可实现传统机器进修的挪用,搭配PaddleTS中丰富的建模全流程东西,足够称心个性化需求。
时序揣测代码示例
ts_forecasting_model = make_ml_model(sklearn.linear_model.LinearRegression, in_chunk_len=16, out_chunk_len=1)
ts_forecasting_model.fit(tsdataset)
res = ts_forecasting_model.predict(tsdataset)
时序反常检测代码示例
ts_anomaly_model = make_ml_model(pyod.models.knn.KNN, in_chunk_len=16)
ts_anomaly_model.fit(tsdataset)
res = ts_anomaly_model.predict(tsdataset)
时序专属的主动建模与集成揣测器
战略更优、操做更简单
PaddleTS将传统的主动建模和集成进修东西停止改进优化,针对时序场景从头设想了愈加便当的建模东西。
主动建模AutoTS:在该模块中内置了默认搜刮空间、超参优化算法、重摘样战略与参数评估战略,开发者仅需2行代码即可完成主动建模的主体操练流程定义。
AutoTS功用代码示例
autots_model = AutoTS(MLPRegressor, 96, 24)
autots_model.fit(tsdataset)
集成揣测器Ensemble:该模块摘用集成进修的思惟,供给两种集成揣测器,开发者通过简单的操做即可把多个PaddleTS揣测器聚集成一个,称心大都场景下的集成需求。
Ensemble功用代码示例
ensemble_model = StackingEnsembleForecaster(96,24,estimators=[(NHiTSModel, nhits_params),(RNNBlockRegressor, rnn_params), (MLPRegressor, mlp_params)])
ensemble_model.fit(ts_train, ts_val)
速度快、效果优
PaddleTS基于飞桨框架,对数据加载、模子操练、模子揣测等核心环节精心打磨优化,效率比拟同类开源产物有十分大的优势。
操练情况:GPU CUDA 11.2,设备 NVIDIA A30
目标阐明:MAE,即绝对均匀误差,它表达揣测值和看测值之间绝对误差的均匀值,越小则揣测效果越好
此外,相较于同类产物,利用PaddleTS中的AutoTS主动建模东西能够获得更优的建模效果,在大大都情状下优于专家体味调参。
WTH数据集:包罗2010年至2013年4年间近1600个美国地域的本地天气数据
*操纵默认的TPE算法,运行50次参数试验
PaddleTS曲播课预告
11月8日(周二)19:00,百度资深工程师将为各人深度解析时序建模算法库PaddleTS,欢送各人报名曲播课,与列位开发者停止手艺和营业深度交换!