机器学习中隐私(privacy in machine learning),工学-信息与通信工程-大数据修订-机器学习中的隐私,计算机在对数据、事实或自身经验的自动分析和综合获取知识的过程中直接或间接蕴含的,涉及个人或组织的,不宜公开的,需要在数据收集、数据存储、数据查询与分析以及数据发布等过程中加以保护的信息。隐私泄露数据的获取和使用必然伴随着隐私问题。对于机器学习而言,隐私问题主要表现在两个方面:①由大规模数据收集导致的直接隐私泄露,主要表现在未经许可的情况下擅自收集个人信息、非法进行数据共享和交易等。②由模型泛化能力不足导致的间接隐私泄露,主要表现在不可靠的数据分析者通过与模型进行交互,从而逆向推理出未知训练数据中的个体敏感属性。间接隐私泄露问题是隐私保护的机器学习领域的研究重点,其产生的根源在于越复杂的模型在训练中往往越具有更强大的数据记忆能力。隐私攻击大多发生在模型应用阶段,由于攻击者无法直接访问训练数据,故只能对相关信息进行推断。攻击者可能对模型和数据一无所知;也可能具有一定的背景知识,如已知模型类型或数据特征。根据攻击者的攻击目标,隐私攻击可分为重构攻击和成员推断攻击等。