【Kronos】专为金融K线设计的开源大模型,让时序预测更懂市场语言
Kronos 是首个面向金融K线(蜡烛图)数据开源的基础模型,它把高噪声、多维的OHLCV价格序列当作一种“语言”来建模,专门解决传统通用时序模型在金融市场预测中泛化性弱、噪声鲁棒性差的问题。
主要特性包括:
– ✅ 专为金融K线设计:采用两阶段框架——先用定制化分词器将连续OHLCV数据量化为层级化离散token,再用解码器-only Transformer进行自回归预训练;
– ✅ 覆盖全球45+交易所数据:预训练数据来源广泛,具备跨市场泛化潜力;
– ✅ 多尺寸模型可选:提供 Kronos-mini(4.1M)、small(24.7M)、base(102.3M)三款开源模型,分别适配轻量推理、研究实验与中等算力场景;
– ✅ 开箱即用的预测接口:通过 KronosPredictor 封装了数据归一化、token化、推理、逆归一化全流程;
– ✅ 支持批量预测与概率采样:提供 predict_batch 方法实现多资产并行预测,并支持温度(T)、核采样(top_p)等参数调节预测不确定性;
– ✅ 开放微调能力:附带完整微调流水线(含Qlib数据接入示例),支持在A股等特定市场数据上进一步适配。
安装与快速使用:
pip install -r requirements.txt
只需几行代码即可完成预测:
from model import Kronos, KronosTokenizer, KronosPredictor
tokenizer = KronosTokenizer.from_pretrained("NeoQuasar/Kronos-Tokenizer-base")
model = Kronos.from_pretrained("NeoQuasar/Kronos-small")
predictor = KronosPredictor(model, tokenizer, max_context=512)
# 输入需含 ['open', 'high', 'low', 'close'] 列的 pandas DataFrame
pred_df = predictor.predict(
df=x_df,
x_timestamp=x_timestamp,
y_timestamp=y_timestamp,
pred_len=120,
T=1.0,
top_p=0.9,
sample_count=1
)
该项目适合以下场景和用户:
– 量化研究员与算法交易初学者:希望快速验证K线预测想法,无需从零构建特征工程与模型架构;
– 高校与实验室研究者:需要可复现、可微调的金融领域基础模型开展下游任务(如信号生成、风险预测、事件驱动建模);
– 金融机构技术团队:在合规前提下,将开源模型作为内部预测系统的技术基座,结合自身数据进行私有化微调;
– 教育场景:用于讲授“金融+AI”交叉课题,直观展示时序大模型如何处理真实市场数据。
总结:Kronos 填补了开源金融大模型的关键空白——它不是通用时序模型的简单迁移,而是从数据表征(分词器)、模型结构到训练目标都深度适配K线特性的务实设计。虽未提供端到端交易策略,但其清晰的模块划分、详实的示例代码与Hugging Face友好集成,显著降低了金融AI的实践门槛。建议访问其主页获取更详细信息。
