引言

引言

在 2025 年,人工智能领域迎来了一个新的里程碑,字节跳动(ByteDance)通过其豆包大模型团队,启动了代号为“Seed Edge”的 AGI 长期研究计划。这个计划旨在探索通用人工智能(AGI)的新方法,鼓励团队成员在一个宽松的研究环境中,进行具有不确定性和大胆的研究课题。本文将深入探讨字节跳动在 AGI 领域的最新进展及其对未来的影响。

字节跳动的创新步伐

字节跳动在人工智能领域的创新步伐一直备受瞩目。2025 年初,字节跳动研究团队推出了一款基于强化学习的智能体应用–PaSa。这款工具能够在短短两分钟内完成繁琐的论文调研工作。通过模仿人类研究者的搜索行为,PaSa 可以自动调用搜索引擎,浏览相关论文并追踪引文网络。与 Google、Google Scholar 等主流检索工具相比,PaSa 在 Recall@20 和 Recall@50 上分别提升了 37.78% 和 39.90%。

Source: 2分钟完成论文调研!ByteDance Research推出论文检索智能体PaSa,远超主流检索工具 from jiqizhixin

Seed Edge 计划的愿景

Seed Edge 计划初步确定了五大研究方向:探索推理能力的边界、探索感知能力的边界、探索软硬一体的下一代模型设计、探索下一代 AI 学习范式、探索下一个 scaling 方向。这些方向不仅展示了字节跳动在 AGI 领域的战略决心,也为未来的人工智能研究提供了新的视角。

Source: 字节启动AGI长期研究计划,代号Seed Edge from jiqizhixin

未来的影响

字节跳动的 AGI 计划和 PaSa 工具展示了其在人工智能领域的创新能力和战略眼光。通过这些前沿研究,字节跳动不仅推动了 AGI 的发展,也为学术研究提供了强大的工具支持。未来,随着技术的不断进步,AGI 将在更多领域展现其潜力。

在这篇文章中,我们将详细探讨字节跳动的 AGI 计划如何通过创新的研究方向和工具,推动人工智能领域的进步,并为未来的技术发展奠定基础。

Seed Edge 計劃的五大研究方向

Seed Edge 計劃的五大研究方向

字节跳动的“Seed Edge”计划在人工智能领域中设定了五个关键研究方向,这些方向不仅展示了其在通用人工智能(AGI)领域的战略决心,也为未来的人工智能研究提供了新的视角。以下是对这五大研究方向的详细探讨。

探索推理能力的边界

推理能力是人工智能系统中至关重要的组成部分。字节跳动的研究团队致力于探索推理能力的极限,以期开发出能够在复杂环境中进行高效决策的智能体。这一研究方向的目标是提升AI在多样化场景中的适应性和灵活性,从而实现更高水平的智能推理。

在这一领域,字节跳动计划通过跨学科合作,结合认知科学和计算机科学的最新进展,开发出新型推理算法。这些算法将被应用于各种实际场景,如自动驾驶、智能家居和医疗诊断等,以验证其有效性和实用性。

探索感知能力的边界

感知能力是AI理解和互动世界的基础。字节跳动的研究团队正在努力突破感知能力的限制,以实现更高精度的环境感知和信息处理。这一研究方向的核心是开发能够模拟人类感知的AI系统,使其在复杂环境中具备更强的识别和理解能力。

通过结合深度学习和计算机视觉技术,字节跳动希望在图像识别、语音识别和自然语言处理等领域取得突破。这将为AI在自动化监控、智能助手和人机交互等应用中提供更强大的支持。

探索软硬一体的下一代模型设计

在软硬件结合的模型设计中,字节跳动的目标是开发出能够在资源受限环境中高效运行的AI系统。这一研究方向强调硬件和软件的协同优化,以提升AI系统的整体性能和能效。

字节跳动计划通过与硬件制造商合作,设计专用芯片和优化算法,以支持大规模AI模型的高效运行。这将为边缘计算、物联网和移动设备等领域的AI应用提供更强大的技术支持。

探索下一代 AI 学习范式

字节跳动正在探索新的AI学习范式,以提升AI系统的学习效率和适应能力。这一研究方向的重点是开发能够在少量数据和有限监督下进行高效学习的AI模型。

通过引入自监督学习、元学习和强化学习等先进技术,字节跳动希望在AI的学习能力上实现质的飞跃。这将为个性化推荐、智能搜索和自动化决策等应用提供更强大的支持。

探索下一个 scaling 方向

在AI模型的扩展方向上,字节跳动致力于开发能够在大规模数据和复杂任务中高效运行的AI系统。这一研究方向的目标是提升AI模型的可扩展性和鲁棒性,以应对未来更复杂的应用需求。

字节跳动计划通过优化模型架构和训练算法,提升AI系统的计算效率和资源利用率。这将为大数据分析、智能制造和智慧城市等领域的AI应用提供更强大的技术支持。

Source: 字节启动AGI长期研究计划,代号Seed Edge from jiqizhixin

通过这些研究方向,字节跳动不仅展示了其在AGI领域的战略眼光,也为未来的人工智能研究提供了新的思路和方向。随着技术的不断进步,这些研究方向将为AI在各个领域的应用奠定坚实的基础。

PaSa:革新學術研究的智能體

PaSa:革新學術研究的智能體

在人工智能的快速发展中,字节跳动的研究团队推出了一款名为 PaSa 的智能体应用,旨在革新学术研究的方式。PaSa 是一款基于强化学习的智能体,能够在短短两分钟内完成繁琐的论文调研工作。通过模仿人类研究者的搜索行为,PaSa 可以自动调用搜索引擎,浏览相关论文并追踪引文网络。与 Google、Google Scholar 等主流检索工具相比,PaSa 在 Recall@20 和 Recall@50 上分别提升了 37.78% 和 39.90%。

PaSa 的核心功能

PaSa 的核心组件包括两个 LLM Agents:Crawler 和 Selector。Crawler 负责收集与用户 Query 相关的学术论文,而 Selector 则负责精读这些论文,决定其是否满足用户需求。在实验中,PaSa-7b 的表现优于所有基线模型,召回率和准确率均有显著提升。

Crawler 的设计

Crawler 的设计旨在最大化相关论文的召回率。它通过自主调用搜索工具、阅读论文、扩展参考文献,不断收集与用户 Query 可能相关的学术论文。Crawler 可以生成多样、互补的搜索词执行多次搜索。此外,Crawler 还能够评估其行为的长期价值,例如在多步扩展引文网络后,Crawler 能够发现许多与用户 Query 相关的论文,即使路径中的中间论文并不直接与用户需求匹配。

Crawler 的工作流程

Source: 2分钟完成论文调研!ByteDance Research推出论文检索智能体PaSa,远超主流检索工具 from jiqizhixin

Selector 的功能

Selector 则强调精确性,即识别论文是否符合用户需求。Selector 主要通过模仿学习进行训练。它会先生成一个 Decision Token,决定论文是否符合用户 Query 的需要。同时,Token Probability 也可以作为相关性分数用于最终结果的排序。在 Decision Token 后,Selector 还会输出决策依据。

实验结果与性能提升

为了验证 PaSa 在真实学术搜索场景中的表现,研究团队开发了一个评测集 –RealScholarQuery。该数据集包含了 AI 研究者提出的真实学术问题,并为每个问题人工构建了对应的相关论文列表。研究团队在 AutoScholarQuery-test 和 RealScholarQuery 两个评测集上,全面对比了 PaSa 与 baselines 的表现。

在 AutoScholarQuery 测试集上,PaSa-7b 的效果优于其他所有的基线模型。与最强的基线 PaSa-GPT-4o 相比,在准确率相当的情况下,PaSa-7b 的召回率提高了 9.64%,Crawler 召回率提高了 3.66%。和 Google 搜索的最好结果相比,Recall@20,Recall@50 和 Recall@100 分别提升了 33.80%,38.83% 和 42.64%。

PaSa 的实验结果

Source: 2分钟完成论文调研!ByteDance Research推出论文检索智能体PaSa,远超主流检索工具 from jiqizhixin

在更接近真实的 RealScholarQuery 上,PaSa-7b 的提升更加明显。与 PaSa-GPT-4o 相比,PaSa-7b 的召回率提高了 30.36%,精确率提高了 4.25%。Google 搜索的最好结果相比,Recall@20,Recall@50 和 Recall@100 分别提升了 37.78%,39.90% 和 39.83%。

结论与未来展望

字节跳动的 AGI 计划和 PaSa 工具展示了其在人工智能领域的创新能力和战略眼光。通过这些前沿研究,字节跳动不仅推动了 AGI 的发展,也为学术研究提供了强大的工具支持。未来,随着技术的不断进步,AGI 将在更多领域展现其潜力。

PaSa 的成功不仅在于其技术上的突破,更在于其为学术研究带来的便利和效率提升。随着 PaSa 的不断优化和推广,学术研究者将能够更专注于创新和发现,而不再被繁琐的文献调研所困扰。

技術細節與實驗結果

技術細節與實驗結果

在字节跳动的 AGI 计划中,PaSa 工具的技术细节和实验结果展示了其在学术研究领域的突破性进展。PaSa 的设计核心在于两个 LLM Agents:Crawler 和 Selector,这两个组件的协同工作使得 PaSa 能够在学术论文检索中表现出色。

Crawler 的设计与功能

Crawler 的设计目标是最大化相关论文的召回率。通过自主调用搜索工具、阅读论文、扩展参考文献,Crawler 不断收集与用户 Query 可能相关的学术论文。它能够生成多样、互补的搜索词执行多次搜索,并评估其行为的长期价值。例如,在多步扩展引文网络后,Crawler 能够发现许多与用户 Query 相关的论文,即使路径中的中间论文并不直接与用户需求匹配。

Crawler 的工作流程

Source: 2分钟完成论文调研!ByteDance Research推出论文检索智能体PaSa,远超主流检索工具 from jiqizhixin

Selector 的功能与训练

Selector 的主要功能是精确识别论文是否符合用户需求。通过模仿学习进行训练,Selector 会生成一个 Decision Token,决定论文是否符合用户 Query 的需要。同时,Token Probability 也可以作为相关性分数用于最终结果的排序。在 Decision Token 后,Selector 还会输出决策依据。

实验结果与性能提升

为了验证 PaSa 在真实学术搜索场景中的表现,研究团队开发了一个评测集 –RealScholarQuery。该数据集包含了 AI 研究者提出的真实学术问题,并为每个问题人工构建了对应的相关论文列表。研究团队在 AutoScholarQuery-test 和 RealScholarQuery 两个评测集上,全面对比了 PaSa 与 baselines 的表现。

在 AutoScholarQuery 测试集上,PaSa-7b 的效果优于其他所有的基线模型。与最强的基线 PaSa-GPT-4o 相比,在准确率相当的情况下,PaSa-7b 的召回率提高了 9.64%,Crawler 召回率提高了 3.66%。和 Google 搜索的最好结果相比,Recall@20,Recall@50 和 Recall@100 分别提升了 33.80%,38.83% 和 42.64%。

PaSa 的实验结果

Source: 2分钟完成论文调研!ByteDance Research推出论文检索智能体PaSa,远超主流检索工具 from jiqizhixin

在更接近真实的 RealScholarQuery 上,PaSa-7b 的提升更加明显。与 PaSa-GPT-4o 相比,PaSa-7b 的召回率提高了 30.36%,精确率提高了 4.25%。Google 搜索的最好结果相比,Recall@20,Recall@50 和 Recall@100 分别提升了 37.78%,39.90% 和 39.83%。

结论与未来展望

字节跳动的 AGI 计划和 PaSa 工具展示了其在人工智能领域的创新能力和战略眼光。通过这些前沿研究,字节跳动不仅推动了 AGI 的发展,也为学术研究提供了强大的工具支持。未来,随着技术的不断进步,AGI 将在更多领域展现其潜力。

PaSa 的成功不仅在于其技术上的突破,更在于其为学术研究带来的便利和效率提升。随着 PaSa 的不断优化和推广,学术研究者将能够更专注于创新和发现,而不再被繁琐的文献调研所困扰。

結論與未來展望

結論與未來展望

字节跳动的 AGI 计划和 PaSa 工具展示了其在人工智能领域的创新能力和战略眼光。通过这些前沿研究,字节跳动不仅推动了 AGI 的发展,也为学术研究提供了强大的工具支持。未来,随着技术的不断进步,AGI 将在更多领域展现其潜力。

AGI 的未来潜力

字节跳动的 AGI 计划不仅仅是技术上的突破,更是对未来人工智能应用的深远影响。AGI 的发展将可能改变多个行业的运作方式,从医疗到金融,再到教育,AGI 的应用将无处不在。字节跳动通过其 Seed Edge 计划,已经在探索这些可能性,并为未来的技术进步奠定了基础。

AGI 的未来应用

Source: 字节启动AGI长期研究计划,代号Seed Edge from jiqizhixin

PaSa 的成功与影响

PaSa 工具的成功不仅在于其技术上的突破,更在于其为学术研究带来的便利和效率提升。随着 PaSa 的不断优化和推广,学术研究者将能够更专注于创新和发现,而不再被繁琐的文献调研所困扰。PaSa 的高效性和准确性使其成为学术界不可或缺的工具。

未来的技术展望

随着 AGI 技术的不断成熟,字节跳动将继续在这一领域进行深入研究。未来,AGI 的应用将不仅限于学术研究,还将扩展到更多的实际应用场景。字节跳动的战略眼光和技术实力将使其在未来的 AGI 发展中占据重要地位。

PaSa 的技术架构

Source: 2分钟完成论文调研!ByteDance Research推出论文检索智能体PaSa,远超主流检索工具 from jiqizhixin

结语

字节跳动的 AGI 计划和 PaSa 工具不仅展示了其在技术上的领先地位,也为未来的人工智能发展提供了新的方向。通过不断的创新和探索,字节跳动将继续引领 AGI 领域的发展,为全球的技术进步贡献力量。未来,随着 AGI 技术的不断进步,我们可以期待更多的突破和应用,这将为人类社会带来深远的影响。

通过这些努力,字节跳动不仅在技术上取得了显著的进步,也为未来的人工智能研究提供了新的视角和方法。随着 AGI 技术的不断发展,字节跳动将继续在这一领域发挥重要作用,为全球的技术进步贡献力量。