TimesFM时间序列模型：预测零售/金融/制造数据

管理员 2 年前

金融科技

759

TimesFM是Google Research开发的一个预训练时间序列基础模型，使用包含1000亿现实世界时间序列数据集进行了预训练，拥有2亿参数，该模型在各种现实世界的预测基准上展现出令人印象深刻的零样本性能。

零样本性能，指模型在没有接受过任何特定任务训练数据的情况下，对该任务的预测能力。

时间序列预测在零售、金融、制造业、医疗保健和自然科学等各个领域无处不在，比如预测股市、降雨量、流感病例、GDP等各种各样的指标，是一种「基于过去预测未来」的科学。

相比非常容易大量爬取的文本数据，时间序列方面的公共数据集非常稀缺。而且为了训练通用的时序模型，数据集中应该包含大量的（百万级别）来自各种领域的多样化数据，且有不同的时间粒度，比如每小时、每日、每周等。

TimesFM的研究团队设法从三个特别渠道找到了这样的时序数据：

Google Trends中的随时间变化的搜索兴趣重新调整为时间序列

Wikipedia页面每小时浏览量随时间变化的数据

合成数据：使用传统的ARMA流程创建数据集

通过大量的数据集创建和评估工作，他们得到了包含1000亿个数据点的数据集。

虽然和Llama含有1T token的语料库依旧存在一定差距，但在时序预测领域是前所未有的大规模数据集。

数据时间模型

LLaMA-Factory Online

在线大模型微调平台 | 一站式低代码训练服务

1563

565

2026-01-28

SQLBot

基于大模型和RAG的智能问数系统

1826

817

2026-01-22

Julius AI

AI 数据大师

1489

495

2026-01-10

Abacus.AI

面向企业和专业人士的 AI 超级助手

4980

1785

2025-06-20

Explorium

构建B2B数据和基础设施

2917

1654

2025-06-04

Data Agent

字节跳动数据智能体

2878

2025-04-11

MCP

Anthropic 开放标准协议 Model Context Protocol

2729

805

2025-03-14

Maxun

网页数据抓取工具

8458

767

2025-01-22

TimesFM时间序列模型：预测零售/金融/制造数据

LLaMA-Factory Online

SQLBot

Julius AI

Abacus.AI

Explorium

Data Agent

MCP

Maxun

Corpus Data : 语料数据

ChatBI

AI 的三大核心基础设施：数据、算力、大模型构架

中国数据标签业务的商业机遇与挑战分析

Scale AI 的创始人兼 CEO Alexandr Wang 深入分析中美 AI 行业的竞争格局

借助 Amazon Q 的生成式 AI 帮助，加速软件开发并利用业务数据

西门子与埃森哲：面向现代电池工程与制造的数据驱动方法

OmniParse：全能解析非结构化数据成易处理的结构化格式

分类

热门文章

最新评论

标签

探索分类

快捷链接

关注我们