Как понять наклон (не выпуклой) функции в точке области?

2021-08-24 01:21:54

Краткое содержание

Рассмотрим следующий абзац из книги «Численные вычисления в глубоком обучении», в котором производная определяется как наклон кривой функции в точке. Предположим, у нас есть функция $y = f(x)$, где $x$ и $y$ — действительные числа. Производная этой функции обозначается как $f'(x)$ или как $\dfrac{dy}{dx}$. Производная $f'(x)$ задает наклон $f(x)$ в точке $x$. Другими словами, она определяет, как масштабировать небольшое изменение во входных данных, чтобы получить соответствующее изменение в выходных: $f(x + \epsilon) \approx f(x) + \epsilon f'(x)$. Наклон функции $f(x)$ в точке $a$ в общем виде определяется как $\tan$ угла, образованного касательной линией в точке $a$ на кривой функции $f(x)$ с положительной осью x в направлении против часовой стрелки. То есть, если $\theta$ — это угол, образованный касательной к кривой $f(x)$ в точке $(a, f(a))$ с положительной осью x в направлении против часовой стрелки, то наклон $f(x)$ в точке $a$ равен $\tan \theta$. Теоретически, касательная линия должна касаться кривой $f(x)$ только в одной точке.

Полный текст

Как понять наклон (не-выпуклой) функции в точке в области определения? Задать вопрос

Задан 4 года, 4 месяца назад Изменен сегодня Просмотрен 110 раз

Задан 4 года, 4 месяца назад

0 $\begingroup$ Рассмотрим следующий абзац из книги "Numerical Computation of deep learning", в котором говорится, что производная — это наклон кривой функции в точке. Предположим, у нас есть функция $y= f(x)$, где и $x$, и $y$ — действительные числа. Производная этой функции обозначается как $f'(x)$ или как $\dfrac{dy}{dx}$. Производная $f'(x)$ дает наклон $f(x)$ в точке $x$. Другими словами, она указывает, как масштабировать небольшое изменение во входных данных, чтобы получить соответствующее изменение в выходных: $f(x+ \epsilon) \approx f(x)+\epsilon f'(x)$. Наклон функции $f(x)$ в точке $a$ в общем виде определяется как $\tan$ угла, образованного касательной линией в точке $a$ на кривой функции $f(x)$ с положительной осью x против часовой стрелки. То есть, если $\theta$ — это угол, образованный касательной к кривой $f(x)$ в точке $(a, f(a))$ с положительной осью x против часовой стрелки. Тогда наклон $f(x)$ в точке $a$ равен $\tan \theta$. Теоретически, касательная линия должна касаться кривой $f(x)$ только в одной точке. Большинство учебников рисуют красивые выпуклые кривые и затем показывают наклон как $\tan \theta$. Но, я думаю, для многих функций невозможно провести касательную линию в точке, которая касается кривой только в этой единственной точке. В противном случае это может быть касательная линия или какое-то другое пересечение. Как понять наклон как $\tan \theta$ в таких случаях? Где я ошибаюсь? math derivative Share Improve this question Follow edited Aug 24, 2021 at 8:07 asked Aug 24, 2021 at 1:21 hanugm 4,182 3 3 gold badges 33 33 silver badges 67 67 bronze badges $\endgroup$ Add a comment | 1 Answer 1 Sorted by: Reset to default Highest score (default) Date modified (newest first) Date created (oldest first) 0 $\begingroup$ Наклон определяется не так. Вы путаете наклон с углом. Определение наклона будет более естественным, как показано ниже. Интуитивно, наклон кривой в точке — это непосредственно то, насколько крутой она изменяется в функции от изменения горизонтального расстояния: плоская дорога не меняет высоту, когда вы едете по ней, но езда по рампе постоянно поднимает вас, когда вы едете вверх по ней. Обычно это понимается как соотношение, так что угол 45 градусов имеет наклон 1, а наклон 30 градусов имеет наклон $\sqrt3$. Это будет формализовано в тригонометрии, но, если я правильно помню, определение может идти и в обратном направлении (что подход с соотношением определяет угол). Мы используем измерения наклона в виде соотношений вместо измерений углов в градусах, потому что вычисление производной с помощью определения через предел дает наклон в виде соотношения напрямую. Этот график довольно хорошо показывает идею, но эта статья дает более четкое изложение. Также существует случай, когда наклон в виде соотношения имеет больше смысла, поскольку техника обратного распространения ошибки (backpropagation) эффективно добавляет/вычитает $ε$ к некоторому $x$ при известном $\Delta f(x)$, сигнале ошибки, полагаясь на уравнение, которое вы опубликовали выше: $f(𝑥+𝜖)≈𝑓(𝑥)+𝜖𝑓′(𝑥)$. Мы можем переписать приведенное выше уравнение, чтобы получить $𝑓(𝑥) - f(𝑥+𝜖) ≈ - 𝜖𝑓′(𝑥)$. Поскольку $\Delta f(x)$ и 𝑓′(𝑥) известны, мы можем также вычислить $𝜖$, но обратите внимание, что вычисляется только правостороннее выражение $𝜖$, поскольку $𝑓(𝑥) - f(𝑥+𝜖)$ получается как $Δ𝑓(𝑥)$. Мы можем разрешить это с помощью правила обновления $x \rightarrow x - \epsilon$ Share Improve this answer Follow edited Aug 24, 2021 at 5:42 answered Aug 24, 2021 at 5:22 k.c. sayz 'k.c sayz' 2,121 13 13 silver badges 27 27 bronze badges $\endgroup$ 5 $\begingroup$ Вы имеете в виду, что $\dfrac{dy}{dx} = \tan \theta$ может быть неверно в некоторых случаях? $\endgroup$ hanugm – hanugm 2021-08-24 05:43:50 +0:00 Commented Aug 24, 2021 at 5:43 1 $\begingroup$ я думаю, вы путаете слово "tangent" с тригонометрическим выражением $\tan$. это разные вещи. $\endgroup$ k.c. sayz 'k.c sayz' – k.c. sayz 'k.c sayz' 2021-08-24 05:47:49 +0

Читать оригинал статьи