Когда на самом деле нужно начинать беспокоиться о конфиденциальности данных в машинном обучении?
Краткое содержание
Я немного изучаю машинное обучение и большая часть того, над чем я работал, использует общедоступные наборы данных, поэтому вопрос конфиденциальности меня не слишком волнует. Но мне постоянно интересно, что происходит, когда ты переходишь от учебных проектов и начинаешь работать с реальными данными. Например, данные пользователей, внутренняя корпоративная информация — всё чувствительное. Такое ощущение, что многие учебные пособия пропускают этот этап и просто фокусируются на создании и развертывании моделей. Я не уверен, какой подход правильный на этом этапе. Люди просто анонимизируют всё и двигаются дальше, или есть более стандартные способы это обрабатывать? Для тех, кто продвинулся дальше: когда это начало становиться тем, о чём нужно думать? И должны ли новички начать изучать это рано, или это скорее вопрос для продвинутых специалистов? Просто пытаюсь понять, как люди подходят к этому в реальных ситуациях. submitted by/u/Comfortable-Week7646[link][comments]
Полный текст статьи пока не загружен.