PHBench

产品概述

PHBench是由Vela Partners和牛津大学开发的可复现、研究级基准测试，直接从Product Hunt发布信号识别A轮融资潜力。基于2019年至2025年的67,292个精选发布进行训练，并与Crunchbase融资记录交叉验证，揭示了早期初创公司成功的统计显著预测因子。其表现最佳的集成模型实现了4.7倍于随机基线的提升，每个新的Product Hunt发布都会自动获得实时预测分数。所有代码、基线模型和匿名化数据集划分均公开可用，使其成为研究人员和投资者的完全开放平台。

主要功能

大规模发布数据集	基于2019-2025年间67,292个精选Product Hunt发布帖子构建，通过确定性域名匹配关联到Crunchbase记录，识别出528个已验证的A轮融资作为真实标签。
61个工程化预测特征	每个发布由61个结构化特征表示，涵盖参与度信号（投票、评论、评价）、排名信号（日榜、周榜、月榜）、创始人属性、时间模式、主题标签和交互项。
经验证的预测能力	顶级集成模型（ENS_avg、ENS_ISO、XGB）在留出测试集上实现了4.7倍于随机基线的提升，将0.78%的基础率转化为可操作的投资信号。
实时在线评分	每个新的Product Hunt发布都会自动从表现最佳的模型获得预测分数，为投资者和创始人提供即时信号，无需人工分析。
公开排行榜与开放提交	公开排行榜根据五项指标评估体系对提交的机器学习和大语言模型进行排名，使用留出的盲测试集进行公平、标准化的比较。
研究级可复现性	提供公开的训练集、验证集和盲测试集划分，以及所有代码和基线模型，遵循与牛津大学共同开发的同行评审方法论。

使用场景

风险投资筛选：风投和天使投资人可以从数千个Product Hunt发布中筛选出排名靠前的潜力项目，优先对预测A轮融资概率最高的初创公司进行尽职调查。
初创公司自我基准测试：创始人可以将自己的Product Hunt发布表现与历史A轮融资成功者进行比较，了解自己的位置以及需要加强哪些信号。
机器学习模型开发与竞赛：数据科学家和研究人员可以提交自己的模型参与公开排行榜竞争，使用标准化数据集和评估体系来衡量真实的预测性能。
学术研究：研究初创公司成功、早期融资动态或风险信号提取的研究人员可以访问一个干净、可引用、有文档记录且经过同行评审方法论的数据集。
市场结构分析：分析师可以利用数据集中的时间性能衰减模式来研究融资市场如何随时间变化，从2020-2021年的繁荣到随后的收缩。

常见问题（FAQ）

什么是PHBench？

PHBench是一个开放基准测试，预测哪些Product Hunt发布将在18个月内获得A轮融资，由Vela Partners和牛津大学基于2019-2025年间的67,292个发布构建。

预测的准确度如何？

表现最佳的集成模型在留出测试集上实现了4.7倍于随机基线的提升。数据集中A轮融资的基础率为0.78%，因此该模型使这一信号具有实际可操作性。

每个预测基于什么数据？

每个发布有61个工程化特征，包括点赞数、评论数、评价数、日榜/周榜/月榜排名、创始人粉丝数、主题类别标签和交互项——全部来自公开的Product Hunt发布页面。

我可以向排行榜提交自己的模型吗？

可以。PHBench提供公开的训练集和验证集划分，以及标准化的五项指标评估体系。向盲测试集提交预测以获得官方评分和排行榜排名。

数据集是公开可用的吗？

可以。匿名化的训练集和验证集划分、全部61个特征、基线模型代码和完整方法论均公开可用。测试标签被保留以保持基准测试的完整性。

它会实时评分新的Product Hunt发布吗？

是的。每个新的精选Product Hunt发布都会自动从表现最佳的集成模型获得实时预测分数。

谁构建了PHBench？

PHBench由量化风投公司Vela Partners与牛津大学合作开发。该方法论经过同行评审并发表在arXiv上。

模型性能会随时间退化吗？

是的。机器学习和大语言模型都显示出与真实融资市场周期一致的时间衰减——在2020-2021年繁荣之后性能下降，证实数据集反映的是真实的市场结构而非静态模式。

发现好站？

PHBench

产品概述

主要功能

使用场景

常见问题（FAQ）