日期:2025年04月14日
4月5日,由中国计算机学会(CCF)主办、CCF YOCSEF郑州组织的“一句话智能交互革命”技术论坛在郑州举办。学院副院长周毅受邀参加。此次论坛以视觉语言动作模型(Vision-Language-Action,VLA)为技术锚点,邀请学界和业界专家,共同绘制从“语言理解”到“物理改造”的技术图谱,探索人工智能扎根现实世界的可行路径。
周毅作为思辨嘉宾,主持核心议题二“针对通用群体智能的VLA是否必需,将VLA应用到通用群体智能领域有哪些挑战?”的研讨。他指出,通用群体智能必须具备三项核心能力:跨模态环境解析、多目标动态决策、群体协同实时控制。将VLA引入群体智能领域,也将面临三重鸿沟:跨模态对齐的复杂性挑战、涌现行为的不可控性挑战、物理约束下的进化悖论。突破这些障碍需要学界与产业界的协同创新,在基础理论层,发展群体强化学习与元认知框架;在工程实现层,构建分布式VLA训练平台;在安全伦理层,考虑建立群体智能的“熔断机制”。
在交流期间,与会专家学者还就“VLA可以落地到哪些应用场景,下一代通用具身智能的关键方向?”和“VLA可能带来哪些社会影响,VLA的评价指标可以有哪些?”等问题进行了热烈讨论,共同探讨VLA前沿技术如何赋能新一代人工智能系统。
微信扫码关注