应用介绍
为了客观评估 OriGene 的性能,研究团队构建了目前靶标发现领域最大的基准测试集 TRQA(Target Research Question-Answering),包含 1915 个专家级别的问答对,涵盖了广泛的疾病和靶标类型范围。在测试中,OriGene 的表现超越了人类专家、通用语言模型(如 GPT-4o 和 DeepSeek-V3),以及现有的专业 AI 智能体系统。
为了客观评估 OriGene 的性能,研究团队构建了目前靶标发现领域最大的基准测试集 TRQA(Target Research Question-Answering),包含 1915 个专家级别的问答对,涵盖了广泛的疾病和靶标类型范围。在测试中,OriGene 的表现超越了人类专家、通用语言模型(如 GPT-4o 和 DeepSeek-V3),以及现有的专业 AI 智能体系统。