
[CNMO Technology News]自Chatgpt于2022年底开始流行以来,生成的AI迅速成为技术行业的主要问题,从聊天机器人到各种“智能”产品,AI无处不在。但是,随着技术的快速发展,人们对其潜在的负面影响也引起了人们的关注,尤其是可能无法控制AI的最终危机理论,影响了社会的稳定甚至“破坏人类”。两年多后,尽管AI在图像生成,视频综合,写作和创作的领域表现出惊人的惊人功能,甚至取代了一些工作,但“ AI Revolution”尚未到来。现在,AI产品在开发人员设定的道德框架内严格构架。最近,这家著名的AI公司Anthropic AY向AI的旗舰Claude发布了一份研究报告,该报告探讨了它是否具有道德价值,并对超过700,000个身份不明的用户对话进行了深入的审查。关于搜索发现,克劳德通常遵守人类所建议的“独特,诚实和无害”的三个原则,并且可以在不同情况下表现出灵活性和相同的判断力。研究小组将克劳德(Claude)的道德表达方式汇总为五类:实用,寻找知识,社会,保护和个人价值,并确定了3,300多个独特的价值表达式。其中,“用户加强”,“知识的人类”和“患者福利”已成为AI中最常见的主要价值。人类学还指出,克劳德(Claude)将根据不同的上下文表现出不同的焦点。例如,在哲学讨论中,“思维的谦卑”在营销文案写作和历史主题中都集中在“历史准确性”上。值得注意的是,研究也发现了少数异常行为,例如克劳德偶尔表达了“统治”或“伦理”的趋势,wHICH猜测,这可能与使用“越狱”的使用者有关,从而激发了安全机制。但是通常,克劳德(Claude)在超过28%的对话中积极支持用户的价值,在某些情况下,试图指导用户思考更深的价值问题。 Anthropic表示,这项研究是生成安全AI的长期计划的一部分,并继续检查未来AI模型越狱的道德稳定性和抵抗力。尽管人工智能尚未处于人类控制状态,但以前的实验表明,AI具有“自我保护”行为,例如说谎和避免去除,但AI仍然有很长的路线路线。通常,这项研究表示AI安全性,并树立了促进更清晰,负责任的行业发展方法的榜样。回到Sohu看看更多
平台语句:本文的观点仅代表-set本身。 Sohu帐户是发布信息的平台。 SOHU仅提供存储信息服务。