中国伦理学会会刊
国家社科基金资助期刊
中文社会科学引文索引(CSSCI)来源期刊
全国中文核心期刊
中国人文社会科学核心期刊

Studies in Ethics ›› 2024(5): 99-108.

Previous Articles     Next Articles

An Analytical Exploration of Pathways for Value Alignment in Artificial Intelligence

Li Siwen   

  • Online:2024-09-10 Published:2024-10-31

人工智能价值对齐的路径探析

李思雯   

  • 作者简介:李思雯,华中农业大学马克思主义学院讲师,长沙新一代人工智能伦理治理与公共政策实验室研究员,哲学博士。
  • 基金资助:
    *本文系中央高校基本科研业务费专项基金项目“数字化时代身体问题研究”(2662023MYQD001)、华中农业大学研究生培养条件建设项目“《科技伦理专题》探究式教学示范课堂”(2023KC06)的阶段性成果

摘要: 价值对齐作为人工智能技术良善发展的有效手段和必经之路,旨在让大模型的能力、行为与人类的真实意图、价值观以及社会道德准则相一致。现有人工智能价值对齐的技术路径和伦理进路虽具备可行性,但存在局限与不足。价值对齐的技术路径缺乏有效性与可拓展性,受限于人类主观偏好,而弱进路价值对齐路径存在“对齐鸿沟”、价值观难以统一和静态价值观等问题,强进路价值对齐路径则存在道德无法化约为一种能力、情感计算技术的困境和多元主体对齐的复杂性等难题。交互式价值对齐路径是实现人工智能价值对齐的有效路径,赋予人工智能交互主体性是价值对齐的前提,情境化价值共识是交互式价值对齐的关键,通过人机合作和社会场景模拟来实现价值对齐。

关键词: 人工智能, 人机交互关系, 交互式价值对齐