WikiDer > LogSumExp - Википедия
Эта статья нужны дополнительные цитаты для проверка. (Август 2015 г.) (Узнайте, как и когда удалить этот шаблон сообщения) |
В LogSumExp (LSE) (также называемый RealSoftMax[1] или многовариантный softplus) функция является гладкий максимум - а гладкий приближение к максимум функция, в основном используемая алгоритмами машинного обучения.[2] Он определяется как логарифм суммы экспонент аргументов:
Характеристики
Домен функции LogSumExp: , то реальное координатное пространство, а его диапазон , то реальная линия. Это приближение к максимальному со следующими оценками
Первое неравенство строгое, если . Второе неравенство становится точным равенством, когда все аргументы равны. Доказательство: Пусть . потом . Применение логарифма к неравенству дает результат.
Кроме того, мы можем масштабировать функцию, чтобы сделать границы более жесткими. Рассмотрим функцию . потом
Доказательство: заменить каждый с для некоторых в неравенствах выше, чтобы дать
и с тех пор
наконец, разделив на дает результат.
Функция LogSumExp является выпуклой и строго монотонно возрастает везде в своей области определения.[3] (но не везде строго выпуклый[4]).
Письмо частные производные:
Что означает градиент LogSumExp - это функция softmax
В выпуклый сопряженный LogSumExp - это отрицательная энтропия.
трюк log-sum-exp для вычислений в лог-области
Функция LSE часто встречается, когда обычные арифметические вычисления выполняются на логарифмическая шкала, как в логарифмическая вероятность.
Подобно тому, как операции умножения в линейном масштабе становятся простыми сложениями в логарифмическом масштабе, операция сложения в линейном масштабе становится LSE в логарифмическом масштабе.
Общей целью использования вычислений в лог-области является повышение точности и избежание проблем с переполнением и переполнением, когда очень маленькие или очень большие числа представлены напрямую (то есть в линейной области) с использованием чисел с плавающей точкой ограниченной точности.
К сожалению, использование LSE напрямую в этом случае может снова вызвать проблемы переполнения / потери значимости. Поэтому вместо этого следует использовать следующий эквивалент (особенно, когда точность приведенного выше приближения `` max '' недостаточна). Следовательно, многие математические библиотеки, такие как IT ++ предоставить подпрограмму LSE по умолчанию и использовать эту формулу внутри компании.
куда
Строго выпуклая функция типа log-sum-exp
LSE является выпуклым, но не строго выпуклым. Мы можем определить строго выпуклую функцию типа log-sum-exp[5] добавив дополнительный аргумент, равный нулю:
Эта функция является собственным генератором Брегмана (строго выпуклой и дифференцируемой). Он встречается в машинном обучении, например, как кумулянт полиномиального / биномиального семейства.
В тропический анализ, это сумма в бревенчатое полукольцо.
Смотрите также
Рекомендации
- ^ Чжан, Астон; Липтон, Зак; Ли, Му; Смола, Алексей. «Погрузитесь в глубокое обучение, Глава 3 Упражнения». www.d2l.ai. Получено 27 июн 2020.
- ^ Нильсен, Франк; Солнце, Кэ (2016). «Гарантированные оценки расходимости Кульбака-Лейблера одномерных смесей с использованием кусочно-логарифмических неравенств». Энтропия. 18: 442. arXiv:1606.05850. Bibcode:2016Entrp..18..442N. Дои:10.3390 / e18120442.
- ^ Эль-Гауи, Лоран (2017). Модели оптимизации и приложения.
- ^ "выпуклый анализ - О строго выпуклости функции логарифма суммы - экспоненты - Обмен математическими стеками". stackexchange.com.
- ^ Нильсен, Франк; Хаджерес, Гаэтан (2018). "Информационная геометрия Монте-Карло: двойственно плоский случай". arXiv:1803.07225. Bibcode:2018arXiv180307225N. Цитировать журнал требует
| журнал =
(помощь)