The Ethical Framework for Value Alignment in Large-Scale Artificial Intelligence Models

Studies in Ethics ›› 2025 (3): 94-99.

Previous Articles Next Articles

The Ethical Framework for Value Alignment in Large-Scale Artificial Intelligence Models

Song Baolin

Online:2025-05-10 Published:2025-06-06

人工智能大模型价值对齐的伦理建构

宋保林

作者简介:宋保林,河南大学马克思主义学院副教授,湖南师范大学科技与社会发展研究中心特约研究员。
基金资助:
本文系国家社会科学基金重大项目“当代新兴增强技术前沿的人文主义哲学研究”（20&ZD044）的阶段性成果

Abstract

摘要： 人工智能大模型技术在助推生产力快速发展的同时,也带来了算法偏见等社会不平等现象。人工智能大模型价值对齐的技术路线在现实中取得积极成效,但是也存在明显的困境,诸如数据标注师以及其他参与人员并非代表更广泛的道德判断和价值取向,人工智能大模型生成的同一内容在不同情境中具有不同的价值呈现。与技术路线相比,人工智能大模型价值对齐的伦理路线注重从先验理性向人机合作理性转变,采用混合式机器道德进路,引导更多利益相关者参与到人工智能大模型价值对齐实践中,在多元文化和多样情境中动态推进人工智能大模型价值对齐,提高人机和谐的程度。

关键词: 人工智能, 大模型, 价值对齐, 伦理建构

Song Baolin. The Ethical Framework for Value Alignment in Large-Scale Artificial Intelligence Models[J]. Studies in Ethics, 2025(3): 94-99.

宋保林. 人工智能大模型价值对齐的伦理建构[J]. 伦理学研究, 2025(3): 94-99.

References

[1] 中国信息通信研究院,中国科学院.大模型治理蓝皮书:从规则走向实践(2023年)[R/OL].(2023-11)[2025-03-17].http://www.caict.ac.cn/kxyj/qwfb/ztbg/202311/P020231124526622371194.pdf.
[2] 腾讯朱雀实验室,腾讯研究院,腾讯混元大模型,等.大模型安全与伦理研究报告2024:以负责任AI引领大模型创新[R/OL].(2024-01-29)[2025-03-17].https://ncstatic-file.clewm.net/rsrc/2024/0129/13/29ef6ae159a0bd8d4e75e5380aae0c47.pdf.
[3] PAN A,CHAN J S,ZOU A,et al. Do the Rewards Justify the Means? Measuring Trade-Offs between Rewards and Ethical Behavior in the Machiavelli Benchmark[M].Honolulu,Hawaii:International Conference on Machine Learning,PMLR,2023.https://dblp.org/db/conf/icml/index.html.
[4] PEREZ E,RINGER S,LUKOSIUTE K,et al. Discovering Language Model Behaviors with Model-Written Evaluations[M]//ROGERS A, BOYD-GRABER J, OKAZAKI N(eds.).Findings of the Association for Computational Linguistics:AGL2023. Toronto:Association for Computational Linguistics,2023. https://aclanthology.org/2023.findings-acl/.
[5] URBINA F,LENTZOS F,INVERNIZZI C,et al. Dual Use of Artificial-Intelligence-Powered Drug Discovery[J].Nature Machine Intelligence,2022(3).
[6] 矣晓沅,谢幸.大模型道德价值观对齐问题剖析[J].计算机研究与发展,2023(9).
[7] 高玉平.从道德建构到政治建构:论罗尔斯的制度理念[J].道德与文明,2010(4).
[8] DeepSeek.“幻方AI & 深度求索 GTC2024 特邀演讲”和而不同:大语言模型价值观对齐解耦化[EB/OL].(2024-03-20)[2025-03-17].https://mp.weixin.qq.com/s/llnNmoQ2p3ZTrMUmS0oH2A.
[9] JI M J,QIU T Y,CHEN B Y,et al. AI Alignment: A Comprehensive Survey[J].arXiv preprint, 2023. arXiv:2310.19852.
[10] 李思雯.人工智能价值对齐的路径探析[J].伦理学研究,2024(5).
[11] 何静.DeepSeek驱动下的范式转型与认知进化[J].阅江学刊,2025(2).

The Ethical Framework for Value Alignment in Large-Scale Artificial Intelligence Models

人工智能大模型价值对齐的伦理建构

PDF

Like

Knowledge

Abstract

Cite this article

share this article

References

Related Articles 0

Recommended Articles

Metrics