深耦合融合(Deep Coupled Fus […]
编码器(Encoder)是人工智能系统中将输 […]
视觉-语言导航(Vision-and-Lan […]
机器人多模态学习是指智能体通过整合视觉、听觉 […]
机器人常识推理(Robotic Common […]
机器人文化敏感性学习是指人工智能系统在跨文化 […]
跨模态嵌入是一种将不同模态的数据(如文本、图 […]
图像到文本生成(Image-to-Text […]
跨模态检索(Cross-Modal Retr […]
多模态提示(Multimodal Promp […]