Data Redaction from Conditional Generative Models

Kong, Zhifeng; Chaudhuri, Kamalika

Computer Science > Machine Learning

arXiv:2305.11351 (cs)

[Submitted on 18 May 2023 (v1), last revised 20 Feb 2024 (this version, v2)]

Title:Data Redaction from Conditional Generative Models

Authors:Zhifeng Kong, Kamalika Chaudhuri

View PDF HTML (experimental)

Abstract:Deep generative models are known to produce undesirable samples such as harmful content. Traditional mitigation methods include re-training from scratch, filtering, or editing; however, these are either computationally expensive or can be circumvented by third parties. In this paper, we take a different approach and study how to post-edit an already-trained conditional generative model so that it redacts certain conditionals that will, with high probability, lead to undesirable content. This is done by distilling the conditioning network in the models, giving a solution that is effective, efficient, controllable, and universal for a class of deep generative models. We conduct experiments on redacting prompts in text-to-image models and redacting voices in text-to-speech models. Our method is computationally light, leads to better redaction quality and robustness than baseline methods while still retaining high generation quality.

Comments:	SaTML 2024
Subjects:	Machine Learning (cs.LG); Computation and Language (cs.CL); Computer Vision and Pattern Recognition (cs.CV)
Cite as:	arXiv:2305.11351 [cs.LG]
	(or arXiv:2305.11351v2 [cs.LG] for this version)
	https://doi.org/10.48550/arXiv.2305.11351

Submission history

From: Zhifeng Kong [view email]
[v1] Thu, 18 May 2023 23:58:53 UTC (21,530 KB)
[v2] Tue, 20 Feb 2024 22:35:32 UTC (21,413 KB)

Computer Science > Machine Learning

Title:Data Redaction from Conditional Generative Models

Submission history

Access Paper:

References & Citations

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators

Computer Science > Machine Learning

Title:Data Redaction from Conditional Generative Models

Submission history

Access Paper:

References & Citations

BibTeX formatted citation

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators