产品概述
PHBench是由Vela Partners和牛津大学开发的可复现、研究级基准测试,直接从Product Hunt发布信号识别A轮融资潜力。基于2019年至2025年的67,292个精选发布进行训练,并与Crunchbase融资记录交叉验证,揭示了早期初创公司成功的统计显著预测因子。其表现最佳的集成模型实现了4.7倍于随机基线的提升,每个新的Product Hunt发布都会自动获得实时预测分数。所有代码、基线模型和匿名化数据集划分均公开可用,使其成为研究人员和投资者的完全开放平台。
主要功能
| 大规模发布数据集 | 基于2019-2025年间67,292个精选Product Hunt发布帖子构建,通过确定性域名匹配关联到Crunchbase记录,识别出528个已验证的A轮融资作为真实标签。 |
| 61个工程化预测特征 | 每个发布由61个结构化特征表示,涵盖参与度信号(投票、评论、评价)、排名信号(日榜、周榜、月榜)、创始人属性、时间模式、主题标签和交互项。 |
| 经验证的预测能力 | 顶级集成模型(ENS_avg、ENS_ISO、XGB)在留出测试集上实现了4.7倍于随机基线的提升,将0.78%的基础率转化为可操作的投资信号。 |
| 实时在线评分 | 每个新的Product Hunt发布都会自动从表现最佳的模型获得预测分数,为投资者和创始人提供即时信号,无需人工分析。 |
| 公开排行榜与开放提交 | 公开排行榜根据五项指标评估体系对提交的机器学习和大语言模型进行排名,使用留出的盲测试集进行公平、标准化的比较。 |
| 研究级可复现性 | 提供公开的训练集、验证集和盲测试集划分,以及所有代码和基线模型,遵循与牛津大学共同开发的同行评审方法论。 |
使用场景
- 风险投资筛选:风投和天使投资人可以从数千个Product Hunt发布中筛选出排名靠前的潜力项目,优先对预测A轮融资概率最高的初创公司进行尽职调查。
- 初创公司自我基准测试:创始人可以将自己的Product Hunt发布表现与历史A轮融资成功者进行比较,了解自己的位置以及需要加强哪些信号。
- 机器学习模型开发与竞赛:数据科学家和研究人员可以提交自己的模型参与公开排行榜竞争,使用标准化数据集和评估体系来衡量真实的预测性能。
- 学术研究:研究初创公司成功、早期融资动态或风险信号提取的研究人员可以访问一个干净、可引用、有文档记录且经过同行评审方法论的数据集。
- 市场结构分析:分析师可以利用数据集中的时间性能衰减模式来研究融资市场如何随时间变化,从2020-2021年的繁荣到随后的收缩。
