7月26日讯,在今天举办的2025世界AI大会上,图灵奖得主约书亚・本吉奥发表了重要演讲。他在演讲中指出,当前AI模型在规划与推理能力方面已取得重大突破。按照这一发展趋势,AI系统在未来十年内有望实现与人类相当的规划与推理水平。
然而,本吉奥也警示称,随着AI技术的快速发展,潜在风险正在逐步显现。如果缺乏有效的防护机制,强大的AI系统可能会加剧虚假信息传播、网络攻击和生物技术滥用等现有威胁。更令人不安的是,具备自我保护能力的智能体一旦发展出超越人类的认知能力,人类将难以对其保持有效控制。
对于这一问题,科学界内部存在广泛担忧。本吉奥强调,由于目前尚未找到可靠的方法来确保AI系统的可信性并使其始终遵循人类设定的目标,我们必须时刻保持高度警惕。特别是在最强的AI模型中,欺骗性和自我保护行为似乎更加普遍。这种现象尤其值得警惕,因为随着AI智能水平的不断提升,其潜在风险也在同步增加。
面对这些挑战,本吉奥建议应在技术和政策两个层面采取积极措施。在技术方面,应当鼓励开发和推广那些不具备潜在危险性的开源AI项目;同时,对可能带来风险的AI研究设定严格限制,并对闭源AI模型实施全面的安全保障措施。这些措施应包括网络安全防护和物理安全设计,以防止其被犯罪组织、恐怖分子或流氓国家滥用。
© 版权声明
文章版权归作者所有,未经允许请勿转载。