研究概述

Scale Lab的研究立足于空间认知和自动化学习的交叉领域,致力于开发能够理解空间信息并自主学习的智能系统。我们的研究涵盖了理论基础和实际应用,旨在推动人工智能和机器人技术的发展。

空间认知 (Spatial Cognition)

空间认知研究关注智能体如何感知、理解和表征空间信息。我们研究智能体如何在复杂环境中导航、定位自身位置、理解空间关系,以及如何利用这些空间知识来完成任务。

研究方向

  • 空间表征学习:开发能够有效表征空间信息的算法和模型
  • 导航与路径规划:研究智能体如何在未知环境中规划路径和导航
  • 空间记忆与推理:探索智能体如何记忆和推理空间信息
  • 多模态空间感知:研究视觉、触觉等多种感知模态如何协同理解空间
空间认知研究

自动化学习 (Automative Learning)

自动化学习研究

自动化学习研究关注如何开发能够自主学习和适应的算法。我们的目标是创建能够在最小人类干预下自主学习和改进的系统。

研究方向

  • 强化学习:开发能够通过与环境交互学习最优策略的算法
  • 元强化学习:研究如何快速适应新任务和环境
  • 自监督学习:探索如何利用未标记数据进行学习
  • 迁移学习:研究如何将学到的知识迁移到新任务和领域

具身人工智能 (Embodied AI)

具身人工智能研究关注物理世界中的智能体如何通过与环境交互来学习和完成任务。

研究方向

  • 具身导航:研究智能体如何在物理环境中导航
  • 视觉语言预训练:探索如何利用视觉和语言信息进行预训练
  • 多模态感知与决策:研究如何整合多种感知模态进行决策
  • 具身链式思考:探索具身智能体如何进行推理和规划
具身人工智能研究

生成式机器人代理 (Generative Robot Agent)

生成式机器人代理研究

生成式机器人代理研究关注如何利用生成模型(如扩散模型)来规划和执行任务。

研究方向

  • 基于扩散模型的规划:研究如何利用扩散模型进行任务规划
  • 技能抽象与分层规划:探索如何通过技能抽象进行分层规划
  • 自适应规划:研究如何根据环境变化调整规划
  • 多智能体协作:探索多个智能体如何协作完成任务

研究项目

EmbodiedGPT

EmbodiedGPT是一个通过具身链式思考进行视觉语言预训练的框架。该项目旨在开发能够理解视觉信息并通过语言进行推理的智能体,使其能够在物理环境中完成复杂任务。

通过结合视觉感知和语言理解,EmbodiedGPT能够在各种环境中执行导航、操作和交互任务。该框架利用具身链式思考方法,使智能体能够将复杂任务分解为一系列可管理的步骤,并通过视觉和语言的结合进行推理和决策。

SkillDiffuser

SkillDiffuser是一个基于扩散模型的分层规划框架,通过技能抽象实现可解释的任务执行。该项目旨在开发能够将复杂任务分解为可管理的子任务,并通过学习技能抽象来提高规划效率和可解释性。

SkillDiffuser通过学习技能抽象,能够在不同层次上理解和执行任务,从高层目标到低层动作。这种分层方法不仅提高了规划效率,还增强了系统的可解释性,使人类能够更好地理解智能体的决策过程。

AdaptDiffuser

AdaptDiffuser是一个将扩散模型作为自适应自进化规划器的框架。该项目旨在开发能够根据环境变化自适应调整规划的智能体,提高其在动态环境中的表现。

通过将扩散模型与自适应学习机制相结合,AdaptDiffuser能够在执行任务过程中不断调整和优化其规划策略。这种自适应能力使智能体能够应对环境变化和不确定性,提高其在复杂和动态环境中的鲁棒性和性能。