Sep 11, 2025 · Artificial Intelligence

Fin-PRM: Alibaba’s Dianjin Team Introduces a Domain-Specific Process Reward Model for Financial Reasoning

Fin‑PRM, a domain‑specific process reward model for financial reasoning introduced by Alibaba’s Dianjin team, employs dual‑level step and trajectory rewards to provide fine‑grained supervision, achieving up to 12.9% accuracy gains in supervised fine‑tuning and 5.1% improvements in Best‑of‑N inference on benchmarks such as CFLUE and FinQA.

CFLUEFin-PRMFinQA

0 likes · 11 min read

Fin-PRM: Alibaba’s Dianjin Team Introduces a Domain-Specific Process Reward Model for Financial Reasoning

AntTech

Jun 21, 2022 · Artificial Intelligence

FinQA Competition Winning Model by Ant Risk AI: Architecture, Dataset, and Experimental Results

Ant Risk AI’s team secured the FinQA competition champion by presenting a comprehensive model that combines a retriever and program generator, detailed dataset analysis, domain-specific language design, and extensive experiments demonstrating superior execution and program accuracy on financial numerical reasoning tasks.

Dataset AnalysisFinQANLP

0 likes · 16 min read

FinQA Competition Winning Model by Ant Risk AI: Architecture, Dataset, and Experimental Results