ТЕХНОЛОГИИ «РАЗОБУЧЕНИЯ» МОДЕЛЕЙ И УСТРАНЕНИЕ НАРУШЕНИЙ АВТОРСКОГО ПРАВА: ПРАВОВЫЕ СТАНДАРТЫ ТЕХНИЧЕСКОГО СООТВЕТСТВИЯ
DOI:
https://doi.org/10.5281/zenodo.18333576Abstract
Современные генеративные модели искусственного интеллекта (например, большие языковые модели и диффузионные модели изображений) обучаются на огромных массивах данных из интернета, значительная часть которых включает охраняемые авторским правом материалы. Это породило новые юридические риски: авторы и правообладатели предъявляют претензии к разработчикам ИИ за несанкционированное использование их контента при обучении моделей. Показательный пример – иск газеты The New York Times против компании OpenAI за незаконное использование статей в тренировочных данных модели. Если суд устанавливает, что в модель были включены чужие произведения без разрешения, возникает вопрос: как устранить нарушение? Традиционный путь – прекращение использования модели или её полное переобучение на очищенном датасете, что крайне ресурсозатратно.
References
Cooper, A. F., Choquette-Choo, C. A., Bogen, M., Jagielski, M., Filippova, K., Liu, K. Z., et al. (2024). Machine Unlearning Doesn’t Do What You Think: Lessons for Generative AI Policy, Research, and Practice. arXiv preprint arXiv:2412.06966.
Dou, G., Liu, Z., Lyu, Q., Ding, K., & Wong, E. (2025). Avoiding Copyright Infringement via Large Language Model Unlearning. arXiv preprint arXiv:2406.10952.
European Data Protection Supervisor. (2023). Machine unlearning. TechSonar report.
Li, G., Hsu, H., Chen, C.-F., & Marculescu, R. (2024). Machine Unlearning for Image-to-Image Generative Models. arXiv preprint arXiv:2402.00351.
Li, T. C. (2022). Algorithmic Destruction. *SMU Law Review, 75(3)**, 479–532.
Marculescu, R., Li, G., Hsu, H., & Chen, C.-F. (2024, March 21). Machine ‘Unlearning’ Helps Generative AI “Forget” Copyright-Protected and Violent Content. UT Austin News