三星电子推出旨在评估人工智能模型在工作环境中生产力的平台 TrueBench,该平台将为企业提供全面指标以跟踪大型语言模型在现实工作场所的生产力。现有基准存在局限,TrueBench 评估与工作相关任务,分 10 个类别和 46 个子类别,支持 12 种语言。三星电子设备体验事业部首席技术官期待其建立生产力评价标准,巩固三星技术领先地位。