WikiDer > Искусственная нейронная сеть
Часть серии по |
Машинное обучение и сбор данных |
---|
Площадки для машинного обучения |
Часть серии по |
Искусственный интеллект |
---|
Технологии |
Глоссарий |
Комплексные системы |
---|
Темы |
Сетевая наука | ||||
---|---|---|---|---|
Типы сетей | ||||
Графики | ||||
| ||||
Модели | ||||
| ||||
| ||||
Искусственные нейронные сети (ИНС), обычно называемый просто нейронные сети (NNs), вычислительные системы смутно вдохновлены биологические нейронные сети которые составляют животное мозги.[1]
ИНС основана на наборе подключенных единиц или узлов, называемых искусственные нейроны, которые свободно моделируют нейроны в биологическом мозге. Каждое соединение, как и синапсы в биологическом мозге может передавать сигнал другим нейронам. Искусственный нейрон, который получает сигнал, затем обрабатывает его и может сигнализировать подключенным к нему нейронам. «Сигналом» при подключении является настоящий номер, и выход каждого нейрона вычисляется некоторой нелинейной функцией суммы его входов. Связи называются края. Нейроны и края обычно имеют масса который корректируется по мере обучения. Вес увеличивает или уменьшает силу сигнала в соединении. Нейроны могут иметь такой порог, что сигнал отправляется только в том случае, если совокупный сигнал пересекает этот порог. Обычно нейроны объединены в слои. Разные слои могут выполнять разные преобразования на своих входах. Сигналы проходят от первого слоя (входной) к последнему (выходному), возможно, после многократного прохождения слоев.
Обучение персонала
Нейронные сети обучаются (или обучаются) на примерах обработки, каждый из которых содержит известные «входные данные» и «результат», формируя между ними взвешенные по вероятности ассоциации, которые хранятся в структуре данных самой сети. Обучение нейронной сети из данного примера обычно проводится путем определения разницы между обработанным выводом сети (часто предсказанием) и целевым выводом. Это ошибка. Затем сеть корректирует свои взвешенные ассоциации в соответствии с правилом обучения и с использованием этого значения ошибки. Последовательные настройки приведут к тому, что нейронная сеть будет выдавать результат, который становится все более похожим на целевой. После достаточного количества этих корректировок обучение может быть прекращено по определенным критериям. Это известно как контролируемое обучение.
Такие системы «учатся» выполнять задачи, рассматривая примеры, как правило, не запрограммированные с помощью правил для конкретных задач. Например, в распознавание изображений, они могут научиться определять изображения с кошками, анализируя примеры изображений, которые были вручную маркированный как «кошка» или «без кошки» и использование результатов для идентификации кошек на других изображениях. Они делают это без каких-либо предварительных знаний о кошках, например, о том, что у них мех, хвосты, усы и кошачьи лица. Вместо этого они автоматически генерируют идентифицирующие характеристики из примеров, которые они обрабатывают.
История
Уоррен МакКаллох и Уолтер Питтс[2] (1943) открыл эту тему, создав вычислительную модель нейронных сетей.[3] В конце 1940-х гг. Д. О. Хебб[4] создал гипотезу обучения, основанную на механизме нейронная пластичность это стало известно как Hebbian обучение. Фарли и Уэсли А. Кларк[5] (1954) сначала использовали вычислительные машины, тогда называемые «калькуляторами», для моделирования сети Хебба. Розенблатт[6] (1958) создал перцептрон.[7] Первые функциональные сети со многими уровнями были опубликованы Ивахненко и Лапа в 1965 г. Групповой метод обработки данных.[8][9][10] Основы непрерывного обратного распространения ошибки[8][11][12][13] были получены в контексте теория управления к Келли[14] в 1960 г. Брайсон в 1961 г.,[15] используя принципы динамическое программирование.
В 1970 г. Сеппо Линнаинмаа опубликовал общий метод для автоматическая дифференциация (AD) дискретных связанных сетей вложенных дифференцируемый функции.[16][17] В 1973 году Дрейфус использовал обратное распространение для адаптации параметры контроллеров пропорционально градиентам ошибок.[18] Werboss (1975) обратное распространение Алгоритм дает возможность практического обучения многослойным сетям. В 1982 году он применил AD-метод Линнаинмаа к нейронным сетям, получив широкое распространение.[11][19] После этого исследования прекратились после Минский и Papert (1969),[20] который обнаружил, что базовые перцептроны неспособны обрабатывать схему исключающего ИЛИ и что компьютерам не хватает мощности для обработки полезных нейронных сетей.
Развитие металл – оксид – полупроводник (MOS) очень крупномасштабная интеграция (СБИС), в виде дополнительный MOS (CMOS) технология, позволяющая увеличить MOS количество транзисторов в цифровая электроникаЭто обеспечило большую вычислительную мощность для разработки практических искусственных нейронных сетей в 1980-х годах.[21]
В 1992 г. макс-пул был введен, чтобы помочь с наименьшей инвариантностью сдвига и толерантностью к деформации, чтобы помочь Распознавание 3D-объектов.[22][23][24] Шмидхубер приняла многоуровневую иерархию сетей (1992), предварительно обучая по одному уровню за раз обучение без учителя и доработан обратное распространение.[25]
Джеффри Хинтон и другие. (2006) предложили изучить высокоуровневое представление с использованием последовательных слоев двоичных или вещественных скрытые переменные с ограниченная машина Больцмана[26] для моделирования каждого слоя. В 2012, Нг и Декан создали сеть, которая научилась распознавать концепции более высокого уровня, такие как кошки, только путем просмотра немаркированных изображений.[27] Неконтролируемое предварительное обучение и увеличенная вычислительная мощность от GPU и распределенных вычислений позволили использовать более крупные сети, особенно в задачах распознавания изображений и визуального распознавания, которые стали известны как "глубокое обучение".[28]
Чиресан и его коллеги (2010)[29] показали, что, несмотря на проблему исчезающего градиента, графические процессоры делают возможным обратное распространение в многослойных нейронных сетях с прямой связью.[30] Между 2009 и 2012 годами ИНС начали выигрывать призы в конкурсах ИНС, приближаясь к человеческому уровню выполнения различных задач, первоначально в распознавание образов и машинное обучение.[31][32] Например, двунаправленный и многомерный долговременная кратковременная память (LSTM)[33][34][35][36] из Могилы и другие. выиграл три конкурса по распознаванию связного почерка в 2009 году, не имея никаких предварительных знаний о трех языках, которые нужно выучить.[35][34]
Чиресан и его коллеги создали первые распознаватели образов для достижения конкурентоспособных / сверхчеловеческих возможностей человека.[37] по тестам, таким как распознавание дорожных знаков (IJCNN 2012).
Модели
Эта секция может быть сбивает с толку или неясно читателям. (Апрель 2017 г.) (Узнайте, как и когда удалить этот шаблон сообщения) |
ИНС начинались как попытка использовать архитектуру человеческого мозга для выполнения задач, с которыми обычные алгоритмы не имели большого успеха. Вскоре они переориентировались на улучшение эмпирических результатов, по большей части отказавшись от попыток остаться верными своим биологическим предшественникам. Нейроны связаны друг с другом по разным схемам, чтобы выходные данные одних нейронов становились входными данными других. Сеть образует направленный, взвешенный график.[38]
Искусственная нейронная сеть состоит из набора смоделированных нейронов. Каждый нейрон - это узел который подключен к другим узлам через ссылки которые соответствуют биологическим связям аксон-синапс-дендрит. У каждой ссылки есть вес, который определяет силу влияния одного узла на другой.[39]
Компоненты ИНС
Нейроны
ИНС состоят из искусственные нейроны которые концептуально происходят из биологических нейроны. Каждый искусственный нейрон имеет входы и производит один выходной сигнал, который может быть отправлен на несколько других нейронов. Входы могут быть значениями характеристик выборки внешних данных, таких как изображения или документы, или они могут быть выходами других нейронов. Результаты финала выходные нейроны нейронной сети выполняют такую задачу, как распознавание объекта на изображении.
Чтобы найти выход нейрона, сначала мы берем взвешенную сумму всех входов, взвешенную по веса из связи от входов к нейрону. Мы добавляем предвзятость срок к этой сумме. Эту взвешенную сумму иногда называют активация. Эта взвешенная сумма затем проходит через (обычно нелинейный) функция активации произвести вывод. Первоначальные входные данные - это внешние данные, такие как изображения и документы. Конечные результаты выполняют задачу, например, распознают объект на изображении.[40]
Соединения и вес
Сеть состоит из соединений, каждое из которых обеспечивает выход одного нейрона в качестве входа для другого нейрона. Каждому соединению присваивается вес, отражающий его относительную важность.[38] У данного нейрона может быть несколько входных и выходных соединений.[41]
Функция распространения
В функция распространения вычисляет входные данные нейрона из выходов предшествующих нейронов и их соединений в виде взвешенной суммы.[38] А предвзятость срок может быть добавлен к результату размножения.[42]
Организация
Нейроны обычно организованы в несколько слоев, особенно в глубокое обучение. Нейроны одного слоя соединяются только с нейронами непосредственно предшествующего и непосредственно следующего слоев. Слой, который получает внешние данные, - это входной слой. Слой, который дает окончательный результат, - это выходной слой. Между ними ноль или больше скрытые слои. Также используются однослойные и неслойные сети. Между двумя уровнями возможны несколько схем соединения. Они могут быть полностью подключен, причем каждый нейрон в одном слое подключается к каждому нейрону следующего слоя. Они могут быть объединение, где группа нейронов в одном слое соединяется с одним нейроном в следующем слое, тем самым уменьшая количество нейронов в этом слое.[43] Нейроны только с такими связями образуют ориентированный ациклический граф и известны как сети прямого распространения.[44] В качестве альтернативы сети, которые позволяют соединения между нейронами в том же или предыдущих слоях, известны как повторяющиеся сети.[45]
Гиперпараметр
Гиперпараметр - это константа параметр значение которого устанавливается до начала процесса обучения. Значения параметров выводятся путем обучения. Примеры гиперпараметров включают скорость обучения, количество скрытых слоев и размер партии.[46] Значения некоторых гиперпараметров могут зависеть от значений других гиперпараметров. Например, размер некоторых слоев может зависеть от общего количества слоев.
Учусь
Этот раздел включает Список ссылок, связанное чтение или внешняя ссылка, но его источники остаются неясными, потому что в нем отсутствует встроенные цитаты. (Август 2019 г.) (Узнайте, как и когда удалить этот шаблон сообщения) |
Обучение - это адаптация сети для лучшего решения задачи с учетом выборочных наблюдений. Обучение включает в себя настройку весов (и необязательных пороговых значений) сети для повышения точности результата. Это достигается за счет минимизации наблюдаемых ошибок. Обучение завершено, когда изучение дополнительных наблюдений не снижает частоту ошибок. Даже после обучения частота ошибок обычно не достигает 0. Если после обучения частота ошибок слишком высока, сеть обычно необходимо перепроектировать. Практически это делается путем определения функция стоимости который периодически оценивается во время обучения. Пока его объем производства продолжает снижаться, обучение продолжается. Стоимость часто определяется как статистика значение которого можно только приблизительно определить. На самом деле выходными данными являются числа, поэтому, когда ошибка мала, разница между результатом (почти наверняка кошка) и правильным ответом (кошка) мала. Обучение пытается уменьшить совокупность различий между наблюдениями.[38] Большинство моделей обучения можно рассматривать как прямое применение оптимизация теория и статистическая оценка.
Скорость обучения
Скорость обучения определяет размер корректирующих шагов, которые модель предпринимает для корректировки ошибок в каждом наблюдении. Высокая скорость обучения сокращает время обучения, но с меньшей конечной точностью, в то время как более низкая скорость обучения занимает больше времени, но с потенциалом для большей точности. Такие оптимизации, как Quickprop в первую очередь направлены на ускорение минимизации ошибок, в то время как другие улучшения в основном направлены на повышение надежности. Чтобы избежать колебаний внутри сети, таких как чередование весов соединений, и повысить скорость сходимости, при уточнениях используется адаптивная скорость обучения который увеличивается или уменьшается по мере необходимости.[47] Концепция импульса позволяет взвешивать баланс между градиентом и предыдущим изменением, так что корректировка веса зависит в некоторой степени от предыдущего изменения. Импульс, близкий к 0, подчеркивает градиент, а значение, близкое к 1, подчеркивает последнее изменение.
Функция затрат
Хотя можно определить функцию стоимости для этого случая, часто выбор определяется желаемыми свойствами функции (такими как выпуклость) или потому, что он возникает из модели (например, в вероятностной модели модель апостериорная вероятность может использоваться как обратная стоимость).
Обратное распространение
Обратное распространение - это метод корректировки весов соединений для компенсации каждой ошибки, обнаруженной во время обучения. Сумма ошибки эффективно распределяется между соединениями. Технически backprop вычисляет градиент (производная) от функция стоимости связанный с данным состоянием относительно весов. Обновить вес можно через стохастический градиентный спуск или другие методы, такие как Машины для экстремального обучения,[48] "Бездопорные" сети,[49] обучение без возврата,[50] «невесомые» сети,[51][52] и неконнекционистские нейронные сети.
Парадигмы обучения
Этот раздел включает Список ссылок, связанное чтение или внешняя ссылка, но его источники остаются неясными, потому что в нем отсутствует встроенные цитаты. (Август 2019 г.) (Узнайте, как и когда удалить этот шаблон сообщения) |
Три основные парадигмы обучения: контролируемое обучение, обучение без учителя и обучение с подкреплением. Каждый из них соответствует определенной учебной задаче.
Контролируемое обучение
Контролируемое обучение использует набор парных входов и желаемых выходов. Задача обучения - произвести желаемый результат для каждого входа. В этом случае функция стоимости связана с устранением неверных вычетов.[53] Обычно используемая стоимость - это среднеквадратичная ошибка, который пытается минимизировать среднеквадратичную ошибку между выходом сети и желаемым выходом. Задачи, подходящие для обучения с учителем: распознавание образов (также известная как классификация) и регресс (также известный как аппроксимация функции). Обучение с учителем также применимо к последовательным данным (например, для рукописного ввода, речи и распознавание жеста). Это можно рассматривать как обучение с «учителем» в форме функции, которая обеспечивает постоянную обратную связь о качестве решений, полученных на данный момент.
Обучение без учителя
В обучение без учителя, входные данные даются вместе с функцией стоимости, некоторая функция данных и выход сети. Функция стоимости зависит от задачи (предметной области) и любого априори предположения (неявные свойства модели, ее параметры и наблюдаемые переменные). В качестве тривиального примера рассмотрим модель куда является константой, а стоимость . Минимизация этой стоимости дает значение что равно среднему значению данных. Функция стоимости может быть намного сложнее. Его форма зависит от приложения: например, в сжатие это может быть связано с взаимная информация между и , тогда как в статистическом моделировании это могло быть связано с апостериорная вероятность модели с учетом данных (обратите внимание, что в обоих этих примерах эти количества будут максимизированы, а не минимизированы). Задачи, подпадающие под парадигму обучения без учителя, как правило, оценка проблемы; приложения включают кластеризация, оценка статистические распределения, сжатие и фильтрация.
Обучение с подкреплением
В таких приложениях, как видеоигры, актер выполняет ряд действий, получая обычно непредсказуемый ответ от окружающей среды после каждого из них. Цель состоит в том, чтобы выиграть игру, то есть получить наиболее положительные (с наименьшими затратами) отзывы. В обучение с подкреплением, цель состоит в том, чтобы взвесить сеть (разработать политику) для выполнения действий, которые минимизируют долгосрочные (ожидаемые совокупные) затраты. В каждый момент времени агент выполняет действие, а среда генерирует наблюдение и мгновенную стоимость в соответствии с некоторыми (обычно неизвестными) правилами. Правила и долгосрочную стоимость обычно можно только оценить. В любой момент агент решает, следует ли исследовать новые действия, чтобы раскрыть свои затраты, или использовать предыдущее обучение, чтобы действовать быстрее.
Формально среда моделируется как Марковский процесс принятия решений (MDP) с состояниями и действия . Поскольку переходы между состояниями неизвестны, вместо них используются распределения вероятностей: распределение мгновенных затрат , распределение наблюдений и переходное распределение , а политика определяется как условное распределение действий с учетом наблюдений. Взятые вместе, эти два определяют Цепь Маркова (MC). Цель состоит в том, чтобы найти MC с самой низкой стоимостью.
ИНС служат обучающим компонентом в таких приложениях.[54][55] Динамическое программирование в сочетании с ИНС (дает нейродинамическое программирование)[56] был применен к проблемам, связанным с движение транспорта,[57] видеоигры, управление природными ресурсами[58][59] и лекарство[60] благодаря способности ИНС снижать потери точности даже при уменьшении плотности сетки дискретизации для численной аппроксимации решения задач управления. Задачи, которые подпадают под парадигму обучения с подкреплением, - это задачи управления, игры и другие задачи последовательного принятия решений.
Самостоятельное обучение
Самообучение в нейронных сетях было введено в 1982 году вместе с нейронной сетью, способной к самообучению, под названием Crossbar Adaptive Array (CAA).[61] Это система только с одним входом, ситуацией s и только одним выходом, действием (или поведением) a. У него нет ни внешнего совета, ни внешнего подкрепления из окружающей среды. CAA перекрестным образом вычисляет как решения о действиях, так и эмоции (чувства) по поводу возникших ситуаций. Система управляется взаимодействием познания и эмоций.[62] Учитывая матрицу памяти W = || w (a, s) ||, алгоритм самообучения ригеля на каждой итерации выполняет следующие вычисления:
В ситуации s выполните действие a; Получите последствия ситуации s '; Вычислить эмоцию пребывания в ситуации последствия v (s ’); Обновить память перекладины w ’(a, s) = w (a, s) + v (s’).
Ценность обратного распространения (вторичное подкрепление) - это эмоция по отношению к ситуации последствий. CAA существует в двух средах: одна - это поведенческая среда, в которой она ведет себя, а другая - генетическая среда, откуда она изначально и только один раз получает начальные эмоции, которые могут возникнуть в поведенческой среде. Получив вектор генома (вектор видов) из генетической среды, CAA будет изучать целенаправленное поведение в поведенческой среде, которая содержит как желательные, так и нежелательные ситуации.[63]
Другой
В Байесовский Для минимизации стоимости выбрано распределение по набору допустимых моделей. Эволюционные методы,[64] программирование экспрессии генов,[65] имитация отжига,[66] ожидание-максимизация, непараметрические методы и оптимизация роя частиц[67] другие алгоритмы обучения. Конвергентная рекурсия - это обучающий алгоритм для контроллер артикуляции модели мозжечка (CMAC) нейронные сети.[68][69]
Режимы
Этот раздел включает Список ссылок, связанное чтение или внешняя ссылка, но его источники остаются неясными, потому что в нем отсутствует встроенные цитаты. (Август 2019 г.) (Узнайте, как и когда удалить этот шаблон сообщения) |
Доступны два режима обучения: стохастический и партия. В стохастическом обучении каждый вход создает корректировку веса. При пакетном обучении веса корректируются на основе пакета входных данных, накапливая ошибки по пакету. Стохастическое обучение вносит «шум» в процесс, используя локальный градиент, рассчитанный из одной точки данных; это снижает вероятность застревания сети в локальных минимумах. Однако пакетное обучение обычно дает более быстрый и стабильный спуск к локальному минимуму, поскольку каждое обновление выполняется в направлении средней ошибки пакета. Распространенным компромиссом является использование «мини-партий», небольших партий с выборками в каждой партии, выбранными стохастически из всего набора данных.
Типы
ИНС превратились в широкое семейство методов, которые продвинули уровень техники во многих областях. Самые простые типы имеют один или несколько статических компонентов, включая количество единиц, количество слоев, веса единиц и топология. Динамические типы позволяют одному или нескольким из них развиваться в процессе обучения. Последние намного сложнее, но могут сократить периоды обучения и дать лучшие результаты. Некоторые типы позволяют / требуют, чтобы обучение «контролировалось» оператором, в то время как другие работают независимо. Некоторые типы работают чисто аппаратно, а другие - чисто программно и работают на компьютерах общего назначения.
Некоторые из основных достижений включают: сверточные нейронные сети которые оказались особенно успешными при обработке визуальных и других двумерных данных;[70][71] долговременная кратковременная память избегайте проблема исчезающего градиента[72] и может обрабатывать сигналы, которые содержат смесь низкочастотных и высокочастотных компонентов, помогая распознавать речь с большим словарным запасом,[73][74] синтез текста в речь,[75][11][76] и фотореалистичные говорящие головы;[77] конкурентные сети, такие как генеративные состязательные сети в несколько сетей (разной структуры) конкурируют друг с другом по таким задачам, как выигрыш в игре[78] или об обмане оппонента относительно подлинности входных данных.[79]
Сетевой дизайн
Поиск нейронной архитектуры (NAS) использует машинное обучение для автоматизации проектирования ИНС. Различные подходы к NAS позволили разработать сети, которые хорошо сопоставимы с системами, созданными вручную. Базовый алгоритм поиска состоит в том, чтобы предложить модель кандидата, сравнить ее с набором данных и использовать результаты в качестве обратной связи для обучения сети NAS.[80] Доступные системы включают AutoML и AutoKeras.[81]
Проблемы проектирования включают определение количества, типа и связности сетевых уровней, а также размера каждого из них и типа соединения (полное, объединение в пул и т. Д.).
Гиперпараметры также должны быть определены как часть дизайна (они не изучаются), управляя такими вопросами, как количество нейронов в каждом слое, скорость обучения, шаг, шаг, глубина, воспринимающее поле и отступ (для CNN) и т. д.[82]
Использовать
Эта секция не цитировать любой источники. (Ноябрь 2020) (Узнайте, как и когда удалить этот шаблон сообщения) |
Использование искусственных нейронных сетей требует понимания их характеристик.
- Выбор модели: это зависит от представления данных и приложения. Слишком сложные модели замедляют обучение.
- Алгоритм обучения: между алгоритмами обучения существует множество компромиссов. Практически любой алгоритм будет работать с правильным гиперпараметры для обучения на конкретном наборе данных. Однако выбор и настройка алгоритма обучения на невидимых данных требует значительных экспериментов.
- Устойчивость: если модель, функция стоимости и алгоритм обучения выбраны надлежащим образом, полученная ИНС может стать надежной.
Возможности ИНС подпадают под следующие широкие категории:[нужна цитата]
- Аппроксимация функции, или же регрессивный анализ, включая прогнозирование временных рядов, приближение пригодности и моделирование.
- Классификация, включая шаблон и распознавание последовательности, обнаружение новизны и последовательное принятие решений.[83]
- Обработка данных, включая фильтрацию, кластеризацию, слепое разделение источников и сжатие.
- Робототехника, в том числе управляющие манипуляторы и протезы.
Приложения
Благодаря своей способности воспроизводить и моделировать нелинейные процессы искусственные нейронные сети нашли применение во многих дисциплинах. Области применения включают идентификация системы и управление (управление транспортным средством, прогнозирование траектории,[84] контроль над процессом, управление природными ресурсами), квантовая химия,[85] общая игра,[86] распознавание образов (радиолокационные системы, идентификация лица, классификация сигналов,[87] 3D реконструкция,[88] распознавание объектов и др.), распознавание последовательности (жест, речь, рукописный и распознавание печатного текста), медицинский диагноз, финансы[89] (например. автоматизированные торговые системы), сбор данных, визуализация, машинный перевод, фильтрация социальных сетей[90] и спам в электронной почте фильтрация. ИНС использовались для диагностики нескольких типов рака.[91] [92] и отличить линии высокоинвазивных раковых клеток от менее инвазивных линий, используя только информацию о форме клеток.[93][94]
ИНС были использованы для ускорения анализа надежности инфраструктуры, подверженной стихийным бедствиям.[95][96] и прогнозировать осадки фундаментов.[97] ИНС также использовались для построения моделей черного ящика в геонаука: гидрология,[98][99] моделирование океана и береговая инженерия,[100][101] и геоморфология.[102] ИНС использовались в информационная безопасность, с целью отличить законные действия от злонамеренных. Например, машинное обучение использовалось для классификации вредоносных программ для Android,[103] для определения доменов, принадлежащих злоумышленникам, и для обнаружения URL-адресов, представляющих угрозу безопасности.[104] В настоящее время ведутся исследования систем ИНС, предназначенных для тестирования на проникновение, для обнаружения ботнетов,[105] мошенничество с кредитными картами[106] и сетевые вторжения.
ИНС были предложены в качестве инструмента для решения уравнения в частных производных в физике[107] и смоделировать свойства многих тел открытые квантовые системы.[108][109][110][111] В исследованиях мозга ИНС изучали краткосрочное поведение отдельные нейроны,[112] динамика нейронных схем возникает из взаимодействий между отдельными нейронами и того, как поведение может возникать из абстрактных нейронных модулей, представляющих полные подсистемы. Исследования рассматривали долгосрочную и краткосрочную пластичность нейронных систем и их связь с обучением и памятью от отдельного нейрона до системного уровня.
Теоретические свойства
Вычислительная мощность
В многослойный персептрон это универсальная функция аппроксиматор, что доказано универсальная аппроксимационная теорема. Однако доказательство не является конструктивным в отношении количества необходимых нейронов, топологии сети, весов и параметров обучения.
Конкретная повторяющаяся архитектура с рациональный-значные веса (в отличие от полной точности настоящий номер-значных весов) имеет степень универсальная машина Тьюринга,[113] с использованием конечного числа нейронов и стандартных линейных связей. Далее, использование иррациональный значений веса приводит к машине с супер-Тьюринг мощность.[114]
Емкость
Свойство модели «емкость» соответствует ее способности моделировать любую заданную функцию. Это связано с объемом информации, которая может храниться в сети, и с понятием сложности. Сообществу известны два понятия емкости. Информационная емкость и VC Dimension. Информационная способность перцептрона интенсивно обсуждается в книге сэра Дэвида Маккея. [115] который обобщает работу Томаса Ковер.[116] Пропускная способность сети стандартных нейронов (не сверточной) может быть определена по четырем правилам. [117] которые проистекают из понимания нейрона как электрический элемент. Информационная емкость охватывает функции, моделируемые сетью при любых входных данных. Второе понятие - это Размер ВК. VC Dimension использует принципы теория меры и находит максимальную емкость при наилучших возможных обстоятельствах. Это при заданных входных данных в определенной форме. Как отмечено в[115] Размер VC для произвольных входов составляет половину информационной емкости персептрона. Размер VC для произвольных точек иногда называют объемом памяти.[118]
Конвергенция
Модели могут не сходиться в едином решении, во-первых, потому что могут существовать локальные минимумы, в зависимости от функции стоимости и модели. Во-вторых, используемый метод оптимизации может не гарантировать сходимости, когда он начинается далеко от любого локального минимума. В-третьих, для достаточно больших данных или параметров некоторые методы становятся непрактичными.
Конвергенция некоторых типов архитектур ИНС изучена лучше, чем других. Когда ширина сети приближается к бесконечности, ИНС хорошо описывается расширением Тейлора первого порядка на протяжении всего обучения и, таким образом, наследует поведение сходимости аффинные модели.[119][120] Другой пример: когда параметры невелики, можно заметить, что ИНС часто соответствуют целевым функциям от низких до высоких частот.[121][122][123][124] Это явление противоположно поведению некоторых хорошо изученных итерационных численных схем, таких как Метод Якоби.
Обобщение и статистика
Этот раздел включает Список ссылок, связанное чтение или внешняя ссылка, но его источники остаются неясными, потому что в нем отсутствует встроенные цитаты. (Август 2019 г.) (Узнайте, как и когда удалить этот шаблон сообщения) |
Приложения, цель которых - создать систему, которая хорошо обобщается на невидимые примеры, сталкиваются с возможностью перетренированности. Это возникает в запутанных или чрезмерно определенных системах, когда пропускная способность сети значительно превышает необходимые свободные параметры. Два подхода к проблеме перетренированности. Первый - использовать перекрестная проверка и аналогичные методы для проверки наличия перетренированности и выбора гиперпараметры чтобы минимизировать ошибку обобщения.
Второй - использовать некоторую форму регуляризация. Эта концепция возникает в вероятностной (байесовской) структуре, где регуляризация может быть выполнена путем выбора большей априорной вероятности по сравнению с более простыми моделями; но также и в теории статистического обучения, где цель состоит в том, чтобы минимизировать более двух величин: «эмпирический риск» и «структурный риск», что примерно соответствует ошибке по обучающей выборке и прогнозируемой ошибке в невидимых данных из-за переобучения.
Контролируемые нейронные сети, использующие среднеквадратичная ошибка (MSE) функция стоимости может использовать формальные статистические методы для определения достоверности обученной модели. MSE в наборе для проверки может использоваться как оценка дисперсии. Это значение затем можно использовать для расчета доверительный интервал сетевого выхода, предполагая нормальное распределение. Проведенный таким образом анализ достоверности статистически достоверен до тех пор, пока вывод распределение вероятностей остается прежним, и сеть не изменяется.
Назначив функция активации softmax, обобщение логистическая функция, на выходном уровне нейронной сети (или компоненте softmax в компонентной сети) для категориальных целевых переменных выходные данные могут интерпретироваться как апостериорные вероятности. Это полезно при классификации, поскольку дает определенную степень уверенности в классификации.
Функция активации softmax:
Критика
Обучение персонала
Распространенная критика нейронных сетей, особенно в робототехнике, заключается в том, что они требуют слишком большого обучения для реальной работы.[нужна цитата] Возможные решения включают в себя случайное перемешивание обучающих примеров с использованием алгоритма численной оптимизации, который не требует слишком больших шагов при изменении сетевых подключений в соответствии с примером, группирование примеров в так называемые мини-пакеты и / или введение рекурсивного алгоритма наименьших квадратов для CMAC.[68]
Теория
Основное возражение состоит в том, что ИНС недостаточно отражают функцию нейронов. Обратное распространение - критический шаг, хотя такого механизма не существует в биологических нейронных сетях.[125] Как информация кодируется реальными нейронами, неизвестно. Сенсорные нейроны Огонь потенциалы действия чаще с активацией датчика и мышечные клетки тянуть сильнее, когда они связаны двигательные нейроны получать потенциалы действия чаще.[126] За исключением случая передачи информации от сенсорного нейрона к двигательному нейрону, почти ничего не известно о принципах того, как информация обрабатывается биологическими нейронными сетями.
Основное требование ИНС - то, что они воплощают новые и мощные общие принципы обработки информации. К сожалению, эти принципы плохо определены. Часто утверждают, что они возникающий из самой сети. Это позволяет описать простую статистическую ассоциацию (основная функция искусственных нейронных сетей) как обучение или распознавание. Александр Дьюдни прокомментировал, что, в результате, искусственные нейронные сети обладают качеством "чего-то даром", которое придает своеобразную ауру лени и явное отсутствие любопытства по поводу того, насколько хороши эти вычислительные системы. Никакой человеческой руки (или разума) вмешивается; решения находят как по волшебству; и никто, кажется, ничему не научился ".[127] Один из ответов Дьюдни заключается в том, что нейронные сети выполняют множество сложных и разнообразных задач, начиная от автономного управления самолетом.[128] к обнаружению мошенничества с кредитными картами к овладению игрой Идти.
Писатель по технологиям Роджер Бриджмен прокомментировал:
Нейронные сети, например, находятся на скамье подсудимых не только потому, что их разрекламировали до небес (а что нет?), Но и потому, что вы можете создать успешную сеть, не понимая, как она работает: набор чисел, который фиксирует ее поведение, по всей вероятности, было бы «непрозрачной, нечитаемой таблицей ... бесполезной как научный ресурс».
Несмотря на его решительное заявление о том, что наука - это не технология, Дьюдни, кажется, здесь называет нейронные сети плохой наукой, когда большинство их изобретателей просто пытаются стать хорошими инженерами. Нечитаемую таблицу, которую могла бы прочитать полезная машина, все равно стоит иметь.[129]
Биологический мозг использует как мелкие, так и глубокие цепи, как сообщает анатомия мозга.[130] демонстрируя широкий спектр инвариантности. Weng[131] утверждал, что мозг самостоятельно подключается в соответствии со статистикой сигналов и, следовательно, последовательный каскад не может уловить все основные статистические зависимости.
Аппаратное обеспечение
Большие и эффективные нейронные сети требуют значительных вычислительных ресурсов.[132] В то время как у мозга есть оборудование, приспособленное для обработки сигналов через график нейронов, моделируя даже упрощенный нейрон на фон Неймана архитектура может потреблять огромное количество объем памяти и хранение. Кроме того, разработчику часто требуется передавать сигналы через многие из этих соединений и связанных с ними нейронов, что требует огромных усилий. ЦПУ сила и время.
Шмидхубер отметил, что возрождение нейронных сетей в двадцать первом веке в значительной степени связано с достижениями в аппаратном обеспечении: с 1991 по 2015 годы вычислительные мощности, особенно предоставляемые GPGPU (на GPU) увеличился примерно в миллион раз, что сделало стандартный алгоритм обратного распространения ошибки применимым для обучающих сетей, которые на несколько уровней глубже, чем раньше.[8] Использование ускорителей, таких как ПЛИС а графические процессоры могут сократить время обучения с месяцев до дней.[133][132]
Нейроморфная инженерия напрямую решает аппаратные трудности, создавая микросхемы, отличные от фон Неймана, для непосредственной реализации нейронных сетей в схемах. Другой тип микросхемы, оптимизированный для обработки нейронных сетей, называется Блок тензорной обработки, или ТПУ.[134]
Практические контрпримеры
Анализировать то, что узнала ИНС, намного проще, чем анализировать то, что узнала биологическая нейронная сеть. Кроме того, исследователи, занимающиеся изучением алгоритмов обучения нейронных сетей, постепенно открывают общие принципы, которые позволяют машине обучения быть успешной. Например, локальное и нелокальное обучение, мелкая или глубокая архитектура.[135]
Гибридные подходы
Защитники гибридный модели (сочетающие нейронные сети и символические подходы) утверждают, что такая смесь может лучше охватить механизмы человеческого разума.[136][137]
Галерея
Смотрите также
Этот "смотрите также" раздел может содержать чрезмерное количество предложений. Пожалуйста, убедитесь, что даются только самые релевантные ссылки, а не красные ссылки, и что никаких ссылок еще нет в этой статье. (Март 2018 г.) (Узнайте, как и когда удалить этот шаблон сообщения) |
- Пределы большой ширины нейронных сетей
- Иерархическая временная память
- 20Q
- АДАЛИН
- Теория адаптивного резонанса
- Искусственная жизнь
- Ассоциативная память
- Автоэнкодер
- BEAM робототехника
- Биологическая кибернетика
- Биологически вдохновленные вычисления
- Проект Голубой мозг
- Катастрофическое вмешательство
- Контроллер артикуляции модели мозжечка (CMAC)
- Когнитивная архитектура
- Наука о мышлении
- Сверточная нейронная сеть (CNN)
- Коннекционистская экспертная система
- Коннектомика
- Культивированные нейронные сети
- Глубокое обучение
- Encog
- Нечеткая логика
- Программирование экспрессии генов
- Генетический алгоритм
- Генетическое программирование
- Групповой метод обработки данных
- Привыкание
- Адаптивное табулирование на месте
- Концепции машинного обучения
- Модели нейронных вычислений
- Нейроэволюция
- Нейронное кодирование
- Нейронный газ
- Нейронный машинный перевод
- Программное обеспечение нейронной сети
- Неврология
- Идентификация нелинейной системы
- Оптическая нейронная сеть
- Параллельные процессы удовлетворения ограничений
- Параллельная распределенная обработка
- Сеть радиальных базисных функций
- Рекуррентные нейронные сети
- Самоорганизующаяся карта
- Пиковая нейронная сеть
- Систолический массив
- Сеть тензорных продуктов
- Нейронная сеть с временной задержкой (TDNN)
Рекомендации
- ^ Чен Юн-Яо; Линь Юй-Сю; Кунг, Чиа-Цзин; Чунг, Мин-Хан; Йен, И.-Сюань (январь 2019). «Разработка и внедрение интеллектуальных счетчиков электроэнергии с использованием облачной аналитики с учетом передового искусственного интеллекта в качестве пограничной аналитики в управлении спросом для умных домов». Датчики. 19 (9): 2047. Дои:10,3390 / с19092047. ЧВК 6539684. PMID 31052502.
- ^ Маккалок, Уоррен; Уолтер Питтс (1943). «Логический расчет идей, имманентных нервной деятельности». Бюллетень математической биофизики. 5 (4): 115–133. Дои:10.1007 / BF02478259.
- ^ Клини, S.C. (1956). «Представление событий в нервных сетях и конечных автоматах». Анналы математических исследований (34). Издательство Принстонского университета. стр. 3–41. Получено 17 июн 2017.
- ^ Хебб, Дональд (1949). Организация поведения. Нью-Йорк: Вили. ISBN 978-1-135-63190-1.
- ^ Farley, B.G .; Кларк (1954). «Моделирование самоорганизующихся систем с помощью цифрового компьютера». Сделки IRE по теории информации. 4 (4): 76–84. Дои:10.1109 / TIT.1954.1057468.
- ^ Розенблатт, Ф. (1958). «Персептрон: вероятностная модель хранения и организации информации в мозгу». Психологический обзор. 65 (6): 386–408. CiteSeerX 10.1.1.588.3775. Дои:10,1037 / ч0042519. PMID 13602029.
- ^ Вербос, П.Дж. (1975). За пределами регрессии: новые инструменты для прогнозирования и анализа в поведенческих науках.
- ^ а б c Шмидхубер, Дж. (2015). «Глубокое обучение в нейронных сетях: обзор». Нейронные сети. 61: 85–117. arXiv:1404.7828. Дои:10.1016 / j.neunet.2014.09.003. PMID 25462637. S2CID 11715509.
- ^ Ивахненко, А. Г. (1973). Кибернетические устройства прогнозирования. Информационная корпорация СКК.
- ^ Ивахненко, А.Г .; Григорьевич Лапа, Валентин (1967). Кибернетика и методы прогнозирования. Американский паб Elsevier. Co.
- ^ а б c Шмидхубер, Юрген (2015). «Глубокое обучение». Scholarpedia. 10 (11): 85–117. Bibcode:2015SchpJ..1032832S. Дои:10.4249 / scholarpedia.32832.
- ^ Дрейфус, Стюарт Э. (1 сентября 1990 г.). «Искусственные нейронные сети, обратное распространение и процедура градиента Келли-Брайсона». Журнал наведения, управления и динамики. 13 (5): 926–928. Bibcode:1990JGCD ... 13..926D. Дои:10.2514/3.25422. ISSN 0731-5090.
- ^ Mizutani, E .; Дрейфус, С.; Нисио, К. (2000). «О выводе обратного распространения MLP из формулы градиента оптимального управления Келли-Брайсона и ее применении». Труды международной совместной конференции IEEE-INNS-ENNS по нейронным сетям. IJCNN 2000. Нейронные вычисления: новые вызовы и перспективы нового тысячелетия. IEEE: 167–172, том 2. Дои:10.1109 / ijcnn.2000.857892. ISBN 0769506194. S2CID 351146.
- ^ Келли, Генри Дж. (1960). «Градиентная теория оптимальных траекторий полета». Журнал ARS. 30 (10): 947–954. Дои:10.2514/8.5282.
- ^ «Градиентный метод оптимизации многоэтапных процессов распределения». Труды Гарвардского унив. Симпозиум по цифровым компьютерам и их приложениям. Апрель 1961 г.
- ^ Линнаинмаа, Сеппо (1970). Представление совокупной ошибки округления алгоритма в виде разложения Тейлора локальных ошибок округления (Мастера) (на финском). Университет Хельсинки. С. 6–7.
- ^ Линнаинмаа, Сеппо (1976). «Разложение Тейлора накопленной ошибки округления». BIT вычислительная математика. 16 (2): 146–160. Дои:10.1007 / bf01931367. S2CID 122357351.
- ^ Дрейфус, Стюарт (1973). «Вычислительное решение задач оптимального управления с запаздыванием». IEEE Transactions по автоматическому контролю. 18 (4): 383–385. Дои:10.1109 / tac.1973.1100330.
- ^ Вербос, Пол (1982). «Применение достижений в нелинейном анализе чувствительности» (PDF). Системное моделирование и оптимизация. Springer. С. 762–770.
- ^ Минский, Марвин; Паперт, Сеймур (1969). Персептроны: введение в вычислительную геометрию. MIT Press. ISBN 978-0-262-63022-1.
- ^ Мид, Карвер А.; Исмаил, Мохаммед (8 мая 1989 г.). Аналоговая реализация нейронных систем на СБИС (PDF). Международная серия Kluwer в области инженерии и информатики. 80. Норвелл, Массачусетс: Kluwer Academic Publishers. Дои:10.1007/978-1-4613-1639-8. ISBN 978-1-4613-1639-8.
- ^ Дж. Венг, Н. Ахуджа и Т. С. Хуанг "Крецептрон: самоорганизующаяся нейронная сеть, которая адаптивно растет," Proc. Международная совместная конференция по нейронным сетям, Балтимор, Мэриленд, том I, стр. 576–581, июнь 1992 г.
- ^ Дж. Венг, Н. Ахуджа и Т. С. Хуанг "Обучение распознаванию и сегментации трехмерных объектов из двухмерных изображений," Proc. 4-я Международная конф. Компьютерное зрение, Берлин, Германия, стр. 121–128, май 1993 г.
- ^ Дж. Венг, Н. Ахуджа и Т. С. Хуанг "Распознавание и сегментация обучения с помощью Cresceptron," Международный журнал компьютерного зрения, т. 25, нет. 2. С. 105–139, ноябрь 1997 г.
- ^ Дж. Шмидхубер. "Изучение сложных, расширенных последовательностей с использованием принципа сжатия истории," Нейронные вычисления4. С. 234–242, 1992.
- ^ Смоленский, П. (1986). «Обработка информации в динамических системах: основы теории гармонии».. В Д. Э. Румельхарте; Дж. Л. Макклелланд; Исследовательская группа PDP (ред.). Параллельная распределенная обработка: исследования микроструктуры познания. 1. стр.194–281. ISBN 9780262680530.
- ^ Нг, Эндрю; Дин, Джефф (2012). «Создание высокоуровневых функций с использованием крупномасштабного обучения без учителя». arXiv:1112.6209 [cs.LG].
- ^ Ян Гудфеллоу, Йошуа Бенжио и Аарон Курвиль (2016). Глубокое обучение. MIT Press.
- ^ Чирешан, Дэн Клаудиу; Мейер, Ули; Гамбарделла, Лука Мария; Шмидхубер, Юрген (21 сентября 2010 г.). «Глубокие, большие, простые нейронные сети для распознавания рукописных цифр». Нейронные вычисления. 22 (12): 3207–3220. arXiv:1003.0358. Дои:10.1162 / neco_a_00052. ISSN 0899-7667. PMID 20858131. S2CID 1918673.
- ^ Доминик Шерер, Андреас К. Мюллер и Свен Бенке: "Оценка операций объединения в сверточные архитектуры для распознавания объектов," На 20-й Международной конференции по искусственным нейронным сетям (ICANN)2010. С. 92–101. Дои:10.1007/978-3-642-15825-4_10.
- ^ Курцвейл, 2012 г., Интервью В архиве 31 августа 2018 г. Wayback Machine с Юрген Шмидхубер о восьми соревнованиях, выигранных его командой Deep Learning 2009–2012 гг.
- ^ «Как глубокое обучение, вдохновленное биологией, продолжает побеждать в соревнованиях | KurzweilAI». www.kurzweilai.net. Архивировано из оригинал 31 августа 2018 г.. Получено 16 июн 2017.
- ^ Грейвс, Алекс; и Шмидхубер, Юрген; Распознавание рукописного ввода в автономном режиме с помощью многомерных рекуррентных нейронных сетейв Бенджио, Йошуа; Шурманс, Дейл; Лафферти, Джон; Уильямс, Крис К. И .; и Кулотта, Арон (ред.), Достижения в системах обработки нейронной информации 22 (NIPS'22), 7–10 декабря 2009 г., Ванкувер, Британская Колумбия, Фонд нейронных систем обработки информации (NIPS), 2009, стр. 545–552.
- ^ а б Graves, A .; Liwicki, M .; Fernandez, S .; Bertolami, R .; Bunke, H .; Шмидхубер, Дж. (2009). «Новая система коннекционистов для улучшенного распознавания рукописного ввода» (PDF). IEEE Transactions по анализу шаблонов и машинному анализу. 31 (5): 855–868. CiteSeerX 10.1.1.139.4502. Дои:10.1109 / тпами.2008.137. PMID 19299860. S2CID 14635907.
- ^ а б Грейвс, Алекс; Шмидхубер, Юрген (2009). Бенхио, Йошуа; Шурманс, Дейл; Лафферти, Джон; Уильямс, редактор Крис - К. Я.; Кулотта, Арон (ред.). «Распознавание рукописного ввода в автономном режиме с помощью многомерных рекуррентных нейронных сетей». Фонд нейронных систем обработки информации (NIPS). Curran Associates, Inc: 545–552.
- ^ Graves, A .; Liwicki, M .; Fernández, S .; Bertolami, R .; Bunke, H .; Шмидхубер, Дж. (Май 2009 г.). «Новая система коннекционистов для неограниченного распознавания почерка». IEEE Transactions по анализу шаблонов и машинному анализу. 31 (5): 855–868. CiteSeerX 10.1.1.139.4502. Дои:10.1109 / тпами.2008.137. ISSN 0162-8828. PMID 19299860. S2CID 14635907.
- ^ Чиресан, Дан; Meier, U .; Шмидхубер, Дж. (Июнь 2012 г.). Многоколоночные глубокие нейронные сети для классификации изображений. Конференция IEEE 2012 года по компьютерному зрению и распознаванию образов. С. 3642–3649. arXiv:1202.2745. Bibcode:2012arXiv1202.2745C. CiteSeerX 10.1.1.300.3283. Дои:10.1109 / cvpr.2012.6248110. ISBN 978-1-4673-1228-8. S2CID 2161592.
- ^ а б c d Зелл, Андреас (2003). «глава 5.2». Моделирование нейроналера Netze [Моделирование нейронных сетей] (на немецком языке) (1-е изд.). Эддисон-Уэсли. ISBN 978-3-89319-554-1. OCLC 249017987.
- ^ Искусственный интеллект (3-е изд.). Аддисон-Уэсли Паб. Co. 1992. ISBN 0-201-53377-4.
- ^ "Словарь машинного обучения". www.cse.unsw.edu.au. Архивировано из оригинал 26 августа 2018 г.. Получено 4 ноября 2009.
- ^ Аббод, Майсам Ф (2007). «Применение искусственного интеллекта для лечения урологического рака». Журнал урологии. 178 (4): 1150–1156. Дои:10.1016 / j.juro.2007.05.122. PMID 17698099.
- ^ ДОУСОН, КРИСТИАН В. (1998). «Подход искусственной нейронной сети к моделированию дождевых стоков». Журнал гидрологических наук. 43 (1): 47–66. Дои:10.1080/02626669809492102.
- ^ Чиресан, Дан; Ули Мейер; Джонатан Маши; Лука М. Гамбарделла; Юрген Шмидхубер (2011). «Гибкие, высокопроизводительные сверточные нейронные сети для классификации изображений» (PDF). Труды двадцать второй международной совместной конференции по искусственному интеллекту - Том второй. 2: 1237–1242. Получено 17 ноября 2013.
- ^ Зелл, Андреас (1994). Симуляторы Neuronaler Netze [Моделирование нейронных сетей] (на немецком языке) (1-е изд.). Эддисон-Уэсли. п. 73. ISBN 3-89319-554-8.
- ^ Милянович, Милош (февраль – март 2012 г.). «Сравнительный анализ нейронных сетей с рекуррентным и конечным импульсным откликом при прогнозировании временных рядов» (PDF). Индийский журнал компьютеров и инженерии. 3 (1).
- ^ Лау, Суки (10 июля 2017 г.). «Пошаговое руководство по сверточной нейронной сети - настройка гиперпараметров». Середина. Получено 23 августа 2019.
- ^ Li, Y .; Fu, Y .; Li, H .; Чжан, С. В. (1 июня 2009 г.). Улучшенный алгоритм обучения нейронной сети обратного распространения с самоадаптивной скоростью обучения. 2009 Международная конференция по вычислительному интеллекту и естественным вычислениям. 1. С. 73–76. Дои:10.1109 / CINC.2009.111. ISBN 978-0-7695-3645-3. S2CID 10557754.
- ^ Хуанг, Гуан-Бинь; Чжу, Цинь-Ю; Сью, Чи-Кхеонг (2006). «Экстремальная обучающая машина: теория и приложения». Нейрокомпьютинг. 70 (1): 489–501. CiteSeerX 10.1.1.217.3692. Дои:10.1016 / j.neucom.2005.12.126.
- ^ Видроу, Бернард; и другие. (2013). «Алгоритм без пропуска: новый алгоритм обучения для многослойных нейронных сетей». Нейронные сети. 37: 182–188. Дои:10.1016 / j.neunet.2012.09.020. PMID 23140797.
- ^ Оливье, Янн; Шарпи, Гийом (2015). «Обучение рекуррентных сетей без возврата». arXiv:1507.07680 [cs.NE].
- ^ ESANN. 2009 г.
- ^ Хинтон, Г. Э. (2010). «Практическое руководство по обучению ограниченных машин Больцмана». Tech. Представитель UTML TR 2010-003.
- ^ Оджа, Варун Кумар; Авраам, Аджит; Снашель, Вацлав (1 апреля 2017 г.). «Метаэвристический дизайн нейронных сетей прямого распространения: обзор двух десятилетий исследований». Инженерные приложения искусственного интеллекта. 60: 97–116. arXiv:1705.05584. Bibcode:2017arXiv170505584O. Дои:10.1016 / j.engappai.2017.01.013. S2CID 27910748.
- ^ Dominic, S .; Das, R .; Whitley, D .; Андерсон, К. (июль 1991 г.). «Генетическое обучение с подкреплением для нейронных сетей». IJCNN-91-Сиэтл Международная совместная конференция по нейронным сетям. IJCNN-91-Сиэтл Международная совместная конференция по нейронным сетям. Сиэтл, Вашингтон, США: IEEE. Дои:10.1109 / IJCNN.1991.155315. ISBN 0-7803-0164-1.
- ^ Хоскинс, J.C .; Химмельблау, Д. (1992). «Управление процессами с помощью искусственных нейронных сетей и обучения с подкреплением». Компьютеры и химическая инженерия. 16 (4): 241–251. Дои:10.1016 / 0098-1354 (92) 80045-Б.
- ^ Бертсекас, Д.П .; Цициклис, Ю. (1996). Нейродинамическое программирование. Athena Scientific. п. 512. ISBN 978-1-886529-10-6.
- ^ Секоманди, Никола (2000). «Сравнение алгоритмов нейродинамического программирования для задачи маршрутизации транспортных средств со стохастическими требованиями». Компьютеры и исследования операций. 27 (11–12): 1201–1225. CiteSeerX 10.1.1.392.4034. Дои:10.1016 / S0305-0548 (99) 00146-X.
- ^ de Rigo, D .; Rizzoli, A.E .; Soncini-Sessa, R .; Weber, E .; Зенези, П. (2001). «Нейродинамическое программирование для эффективного управления сетями коллектора». Материалы Международного конгресса по моделированию и имитационному моделированию MODSIM 2001. MODSIM 2001, Международный конгресс по моделированию и симуляции. Канберра, Австралия: Общество моделирования и моделирования Австралии и Новой Зеландии. Дои:10.5281 / zenodo.7481. ISBN 0-867405252.
- ^ Дамас, М .; Salmeron, M .; Diaz, A .; Ортега, Дж .; Прието, А .; Оливарес, Г. (2000). «Генетические алгоритмы и нейродинамическое программирование: применение в сетях водоснабжения». Труды Конгресса 2000 г. по эволюционным вычислениям. 2000 Конгресс по эволюционным вычислениям. Ла-Хойя, Калифорния, США: IEEE. Дои:10.1109 / CEC.2000.870269. ISBN 0-7803-6375-2.
- ^ Дэн, Гэн; Феррис, М. (2008). Нейродинамическое программирование для планирования фракционной лучевой терапии. Оптимизация Springer и ее приложения. 12. С. 47–70. CiteSeerX 10.1.1.137.8288. Дои:10.1007/978-0-387-73299-2_3. ISBN 978-0-387-73298-5.
- ^ Божиновский, С. (1982). «Самообучающаяся система с использованием вторичного подкрепления». В Р. Траппл (ред.) Кибернетика и системные исследования: материалы шестого европейского совещания по кибернетике и системным исследованиям. Северная Голландия. С. 397–402. ISBN 978-0-444-86488-8.
- ^ Божиновский, С. (2014) "Моделирование механизмов когнитивно-эмоционального взаимодействия в искусственных нейронных сетях с 1981 г.. "Процедуры информатики стр. 255-263
- ^ Божиновски, Стево; Божиновская, Лиляна (2001). «Самообучающиеся агенты: коннекционистская теория эмоций, основанная на перекрестных оценочных суждениях». Кибернетика и системы. 32 (6): 637–667. Дои:10.1080/01969720118145. S2CID 8944741.
- ^ de Rigo, D .; Castelletti, A .; Rizzoli, A.E .; Soncini-Sessa, R .; Вебер, Э. (январь 2005 г.). «Метод выборочного улучшения для закрепления нейродинамического программирования в управлении сетью водных ресурсов». У Павла Зитека (ред.). Материалы 16-го Всемирного конгресса МФБ - IFAC-PapersOnLine. 16-й Всемирный Конгресс МФБ. 16. Прага, Чешская Республика: IFAC. Дои:10.3182 / 20050703-6-CZ-1902.02172. HDL:11311/255236. ISBN 978-3-902661-75-3. Получено 30 декабря 2011.
- ^ Феррейра, К. (2006). «Проектирование нейронных сетей с использованием программирования экспрессии генов» (PDF). В A. Abraham, B. de Baets, M. Köppen и B. Nickolay, eds., Applied Soft Computing Technologies: The Challenge of Complex, стр. 517–536, Springer-Verlag.
- ^ День.; Сюрун, Г. (июль 2005 г.). Т. Вилльманн (ред.). Усовершенствованная ИНС на основе PSO с имитацией отжига. Новые аспекты нейрокомпьютинга: 11-й Европейский симпозиум по искусственным нейронным сетям. Эльзевир. Дои:10.1016 / j.neucom.2004.07.002.
- ^ Wu, J .; Чен, Э. (май 2009 г.). Wang, H .; Shen, Y .; Huang, T .; Цзэн, З. (ред.). Новый ансамбль непараметрической регрессии для прогнозирования осадков с использованием метода оптимизации роя частиц в сочетании с искусственной нейронной сетью. 6-й Международный симпозиум по нейронным сетям, ISNN 2009. Springer. Дои:10.1007/978-3-642-01513-7-6. ISBN 978-3-642-01215-0.
- ^ а б Тинг Цинь и др. "Алгоритм обучения CMAC на основе RLS. "Письма о нейронной обработке 19.1 (2004): 49–61.
- ^ Тинг Цинь и др. "Непрерывный CMAC-QRLS и его систолический массив. »Neural Processing Letters 22.1 (2005): 1–16.
- ^ LeCun и другие., «Обратное распространение, применяемое для распознавания рукописного почтового индекса», Нейронные вычисления1. С. 541–551, 1989.
- ^ Янн ЛеКун (2016). Слайды по глубокому обучению В сети
- ^ Хохрайтер, Зепп; Шмидхубер, Юрген (1 ноября 1997 г.). «Кратковременная долговременная память». Нейронные вычисления. 9 (8): 1735–1780. Дои:10.1162 / neco.1997.9.8.1735. ISSN 0899-7667. PMID 9377276. S2CID 1915014.
- ^ Сак, хасим; Старший, Андрей; Бофэ, Франсуаза (2014). «Рекуррентные архитектуры нейронных сетей с кратковременной памятью для крупномасштабного акустического моделирования» (PDF). Архивировано из оригинал (PDF) 24 апреля 2018 г.
- ^ Ли, Сянган; У, Сихун (15 октября 2014 г.). «Построение глубоких рекуррентных нейронных сетей на основе кратковременной памяти для распознавания речи с большим словарным запасом». arXiv:1410.4281 [cs.CL].
- ^ Fan, Y .; Qian, Y .; Xie, F .; Сунг, Ф. К. (2014). «Синтез TTS с двунаправленными рекуррентными нейронными сетями на основе LSTM». Материалы ежегодной конференции Международной ассоциации речевой коммуникации, Interspeech: 1964–1968. Получено 13 июн 2017.
- ^ Дзен, Хейга; Сак, Хасим (2015). «Однонаправленная рекуррентная нейронная сеть с долговременной кратковременной памятью с рекуррентным выходным уровнем для синтеза речи с малой задержкой» (PDF). Google.com. ICASSP. С. 4470–4474.
- ^ Fan, Bo; Ван, Лицзюань; Сунг, Фрэнк К .; Се, Лэй (2015). "Фотореалистичная говорящая голова с глубоким двунаправленным LSTM" (PDF). Труды ICASSP.
- ^ Сильвер, Дэвид; Хуберт, Томас; Шриттвизер, Джулиан; Антоноглоу, Иоаннис; Лай, Мэтью; Гез, Артур; Ланкто, Марк; Сифре, Лоран; Кумаран, Дхаршан; Грэпель, Тор; Лилликрап, Тимоти; Симонян, Карен; Хассабис, Демис (5 декабря 2017 г.). «Освоение шахмат и сёги путем самостоятельной игры с использованием общего алгоритма обучения с подкреплением». arXiv:1712.01815 [cs.AI].
- ^ Гудфеллоу, Ян; Пуже-Абади, Жан; Мирза, Мехди; Сюй, Бинг; Вард-Фарли, Дэвид; Озаир, Шерджил; Курвиль, Аарон; Бенжио, Йошуа (2014). Генеративные состязательные сети (PDF). Труды Международной конференции по системам обработки нейронной информации (NIPS 2014). С. 2672–2680.
- ^ Зоф, Баррет; Ле, Куок В. (4 ноября 2016 г.). «Поиск нейронной архитектуры с обучением с подкреплением». arXiv:1611.01578 [cs.LG].
- ^ «Автокерас». autokeras.com. Получено 21 августа 2019.
- ^ «Клезен, Марк и Барт Де Моор.« Поиск гиперпараметров в машинном обучении ». Препринт arXiv arXiv: 1502.02127 (2015)». arXiv:1502.02127. Bibcode:2015arXiv150202127C.
- ^ Турек, Фред Д. (март 2007 г.). «Введение в машинное зрение нейронной сети». Дизайн систем технического зрения. 12 (3). Получено 5 марта 2013.
- ^ Зиссис, Димитриос (октябрь 2015 г.). «Облачная архитектура, способная воспринимать и прогнозировать поведение нескольких судов». Прикладные мягкие вычисления. 35: 652–661. Дои:10.1016 / j.asoc.2015.07.002.
- ^ Роман Михайлович Балабин; Екатерина Ивановна Ломакина (2009). «Нейросетевой подход к данным квантовой химии: точное предсказание энергий теории функционала плотности». J. Chem. Phys. 131 (7): 074104. Bibcode:2009ЖЧФ.131г4104Б. Дои:10.1063/1.3206326. PMID 19708729.
- ^ Сильвер, Дэвид; и другие. (2016). «Освоение игры в го с помощью глубоких нейронных сетей и поиска по дереву» (PDF). Природа. 529 (7587): 484–9. Bibcode:2016Натура.529..484S. Дои:10.1038 / природа16961. PMID 26819042. S2CID 515925.
- ^ Сенгупта, Нандини; Сахидулла, штат Мэриленд; Саха, Гоутам (август 2016 г.). «Классификация легочных звуков с использованием статистических характеристик на основе кепстра». Компьютеры в биологии и медицине. 75 (1): 118–129. Дои:10.1016 / j.compbiomed.2016.05.013. PMID 27286184.
- ^ Чой, Кристофер Б. и др. "3d-r2n2: единый подход к одно- и многовидовой реконструкции трехмерных объектов. »Европейская конференция по компьютерному зрению. Springer, Cham, 2016.
- ^ Французский, Иордания (2016). "CAPM путешественника во времени". Журнал инвестиционных аналитиков. 46 (2): 81–96. Дои:10.1080/10293523.2016.1255469. S2CID 157962452.
- ^ Шехнер, Сэм (15 июня 2017 г.). «Facebook усиливает ИИ, чтобы блокировать террористическую пропаганду». Wall Street Journal. ISSN 0099-9660. Получено 16 июн 2017.
- ^ Ганесан, Н. (2010). «Применение нейронных сетей в диагностике рака с использованием демографических данных». Международный журнал компьютерных приложений. 1 (26): 81–97. Bibcode:2010IJCA .... 1z..81G. Дои:10.5120/476-783.
- ^ Боттачи, Леонардо (1997). «Искусственные нейронные сети, применяемые для прогнозирования результатов у пациентов с колоректальным раком в отдельных учреждениях» (PDF). Ланцет. Ланцет. 350 (9076): 469–72. Дои:10.1016 / S0140-6736 (96) 11196-X. PMID 9274582. S2CID 18182063. Архивировано из оригинал (PDF) 23 ноября 2018 г.. Получено 2 мая 2012.
- ^ Ализаде, Элахе; Lyons, Samanthe M; Замок, Иордания M; Прасад, Ашок (2016). «Измерение систематических изменений формы инвазивных раковых клеток с использованием моментов Цернике». Интегративная биология. 8 (11): 1183–1193. Дои:10.1039 / C6IB00100A. PMID 27735002.
- ^ Лион, Саманта (2016). «Изменения формы клеток коррелируют с метастатическим потенциалом у мышей». Биология Открыть. 5 (3): 289–299. Дои:10.1242 / bio.013409. ЧВК 4810736. PMID 26873952.
- ^ Набиан, Мохаммад Амин; Мейдани, Хади (28 августа 2017 г.). «Глубокое обучение для ускоренного анализа надежности инфраструктурных сетей». Компьютерное проектирование строительства и инфраструктуры. 33 (6): 443–458. arXiv:1708.08551. Bibcode:2017arXiv170808551N. Дои:10.1111 / мышей.12359. S2CID 36661983.
- ^ Набиан, Мохаммад Амин; Мейдани, Хади (2018). «Ускорение стохастической оценки связности транспортной сети после землетрясения с помощью суррогатов на основе машинного обучения». 97-е ежегодное собрание Совета по транспортным исследованиям.
- ^ Díaz, E .; Бротоны, В .; Томас, Р. (сентябрь 2018 г.). «Использование искусственных нейронных сетей для прогнозирования трехмерной упругой осадки фундаментов на грунтах с наклонным основанием». Почвы и фундаменты. 58 (6): 1414–1422. Дои:10.1016 / j.sandf.2018.08.001. HDL:10045/81208. ISSN 0038-0806.
- ^ null null (1 апреля 2000 г.). "Искусственные нейронные сети в гидрологии. I: Предварительные концепции". Журнал гидрологической инженерии. 5 (2): 115–123. CiteSeerX 10.1.1.127.3861. Дои:10.1061 / (ASCE) 1084-0699 (2000) 5: 2 (115).
- ^ null null (1 апреля 2000 г.). "Искусственные нейронные сети в гидрологии. II: Гидрологические приложения". Журнал гидрологической инженерии. 5 (2): 124–137. Дои:10.1061 / (ASCE) 1084-0699 (2000) 5: 2 (124).
- ^ Перес, Д. Дж .; Iuppa, C .; Cavallaro, L .; Cancelliere, A .; Фоти, Э. (1 октября 2015 г.). «Значительное расширение рекордов высоты волны с помощью нейронных сетей и данных повторного анализа ветра». Моделирование океана. 94: 128–140. Bibcode:2015OcMod..94..128P. Дои:10.1016 / j.ocemod.2015.08.002.
- ^ Дваракиш, Г. С .; Ракшит, Шетти; Натесан, Уша (2013). «Обзор применения нейронной сети в прибрежной инженерии». Системы искусственного интеллекта и машинное обучение. 5 (7): 324–331.
- ^ Эрмини, Леонардо; Катани, Филиппо; Касагли, Никола (1 марта 2005 г.). «Искусственные нейронные сети, применяемые для оценки подверженности оползням». Геоморфология. Геоморфологическая опасность и антропогенное воздействие в горной среде. 66 (1): 327–343. Bibcode:2005 Geomo..66..327E. Дои:10.1016 / j.geomorph.2004.09.025.
- ^ Nix, R .; Чжан, Дж. (Май 2017 г.). «Классификация Android-приложений и вредоносных программ с использованием глубоких нейронных сетей». 2017 Международная совместная конференция по нейронным сетям (IJCNN): 1871–1878. Дои:10.1109 / IJCNN.2017.7966078. ISBN 978-1-5090-6182-2. S2CID 8838479.
- ^ «Обнаружение вредоносных URL-адресов». Группа систем и сетей в UCSD. Архивировано из оригинал 14 июля 2019 г.. Получено 15 февраля 2019.
- ^ Хомаюн, Саджад; Ахмадзаде, Марзие; Хашеми, Саттар; Дехгантанха, Али; Хайями, Рауф (2018), Дехгантанья, Али; Конти, Мауро; Даргахи, Тооска (ред.), «BoTShark: подход с глубоким обучением для обнаружения трафика ботнетов», Анализ киберугроз, Достижения в области информационной безопасности, Springer International Publishing, стр. 137–153, Дои:10.1007/978-3-319-73951-9_7, ISBN 9783319739519
- ^ и (январь 1994 г.). «Обнаружение мошенничества с кредитными картами с помощью нейронной сети». 1994 Материалы двадцать седьмой Гавайской международной конференции по системным наукам. 3: 621–630. Дои:10.1109 / HICSS.1994.323314. ISBN 978-0-8186-5090-1. S2CID 13260377.
- ^ «ИИ разгадал ключевую математическую головоломку для понимания нашего мира». Обзор технологий MIT. Получено 19 ноября 2020.
- ^ Надя, Александра (28 июня 2019 г.). «Вариационный квантовый метод Монте-Карло с нейросетевым анзацем для открытых квантовых систем». Письма с физическими проверками. 122 (25): 250501. arXiv:1902.09483. Bibcode:2019PhRvL.122y0501N. Дои:10.1103 / PhysRevLett.122.250501. PMID 31347886. S2CID 119074378.
- ^ Йошиока, Нобуюки; Хамазаки, Рюсукэ (28 июня 2019 г.). «Построение нейронных стационарных состояний для открытых квантовых систем многих тел». Физический обзор B. 99 (21): 214306. arXiv:1902.07006. Bibcode:2019arXiv190207006Y. Дои:10.1103 / PhysRevB.99.214306. S2CID 119470636.
- ^ Хартманн, Майкл Дж .; Карлео, Джузеппе (28 июня 2019 г.). "Нейросетевой подход к диссипативной квантовой динамике многих тел". Письма с физическими проверками. 122 (25): 250502. arXiv:1902.05131. Bibcode:2019arXiv190205131H. Дои:10.1103 / PhysRevLett.122.250502. PMID 31347862. S2CID 119357494.
- ^ Висентини, Филиппо; Биелла, Альберто; Реньо, Николя; Чути, Криштиану (28 июня 2019 г.). "Вариационный нейросетевой анзац для стационарных состояний в открытых квантовых системах". Письма с физическими проверками. 122 (25): 250503. arXiv:1902.10104. Bibcode:2019arXiv190210104V. Дои:10.1103 / PhysRevLett.122.250503. PMID 31347877. S2CID 119504484.
- ^ Форрест, доктор медицины (апрель 2015 г.). «Моделирование действия алкоголя на детальной модели нейрона Пуркинье и более простой суррогатной модели, которая работает в> 400 раз быстрее». BMC Neuroscience. 16 (27): 27. Дои:10.1186 / s12868-015-0162-6. ЧВК 4417229. PMID 25928094.
- ^ Siegelmann, H.T .; Зонтаг, Э. (1991). «Вычислимость по Тьюрингу с нейронными сетями» (PDF). Appl. Математика. Латыш. 4 (6): 77–80. Дои:10.1016 / 0893-9659 (91) 90080-Ф.
- ^ Балькасар, Хосе (июль 1997 г.). «Вычислительная мощность нейронных сетей: характеристика колмогоровской сложности». IEEE Transactions по теории информации. 43 (4): 1175–1183. CiteSeerX 10.1.1.411.7782. Дои:10.1109/18.605580.
- ^ а б Маккей, Дэвид, Дж. (2003). Теория информации, логический вывод и алгоритмы обучения (PDF). Издательство Кембриджского университета. ISBN 9780521642989.CS1 maint: ref = harv (связь)
- ^ Обложка, Томас (1965). «Геометрические и статистические свойства систем линейных неравенств с приложениями в распознавании образов» (PDF). Транзакции IEEE на электронных компьютерах. IEEE (3): 326–334. Дои:10.1109 / PGEC.1965.264137.
- ^ Джеральд, Фридланд (2019). «Воспроизводимость и экспериментальный дизайн для машинного обучения аудио и мультимедийных данных». MM '19: Материалы 27-й Международной конференции ACM по мультимедиа. ACM: 2709–2710. Дои:10.1145/3343031.3350545. ISBN 9781450368896. S2CID 204837170.
- ^ «Тензорфотомер».
- ^ Ли, Джэхун; Сяо, Лехао; Schoenholz, Samuel S .; Бахри, Ясаман; Новак, Роман; Золь-Дикштейн, Яша; Пеннингтон, Джеффри (15 февраля 2018 г.). «Широкие нейронные сети любой глубины развиваются как линейные модели при градиентном спуске». arXiv:1902.06720. Цитировать журнал требует
| журнал =
(помощь) - ^ [1], Нейронно-касательное ядро: сходимость и обобщение в нейронных сетях.
- ^ [2], Поведение при обучении глубокой нейронной сети в частотной области.
- ^ [3], О спектральном смещении нейронных сетей.
- ^ [4], Принцип частоты: анализ Фурье проливает свет на глубокие нейронные сети.
- ^ [5], Теория частотного принципа для общих глубоких нейронных сетей.
- ^ Крик, Фрэнсис (1989). «Недавний ажиотаж по поводу нейронных сетей». Природа. 337 (6203): 129–132. Bibcode:1989Натура.337..129C. Дои:10.1038 / 337129a0. PMID 2911347. S2CID 5892527.
- ^ Адриан, Эдвард Д. (1926). «Импульсы, производимые сенсорными нервными окончаниями». Журнал физиологии. 61 (1): 49–72. Дои:10.1113 / jphysiol.1926.sp002273. ЧВК 1514809. PMID 16993776.
- ^ Дьюдни, А. К. (1 апреля 1997 г.). Да, у нас нет нейтронов: открывающий глаза тур по перипетиям плохой науки. Вайли. п. 82. ISBN 978-0-471-10806-1.
- ^ НАСА - Центр летных исследований Драйдена - Комната новостей: Пресс-релизы: ПРОЕКТ НАСА НЕЙРОННОЙ СЕТИ ПРОХОДИТ ВЕХУ. Nasa.gov. Проверено 20 ноября 2013.
- ^ "Защита нейронных сетей Роджером Бриджменом". Архивировано из оригинал 19 марта 2012 г.. Получено 12 июля 2010.
- ^ Д. Дж. Феллеман и Д. К. Ван Эссен "Распределенная иерархическая обработка в коре головного мозга приматов," Кора головного мозга, 1, стр. 1–47, 1991.
- ^ Дж. Венг "Естественный и искусственный интеллект: введение в вычислительный мозг, "БМИ Пресс, ISBN 978-0985875725, 2012.
- ^ а б Эдвардс, Крис (25 июня 2015 г.). «Растущие боли для глубокого обучения». Коммуникации ACM. 58 (7): 14–16. Дои:10.1145/2771283. S2CID 11026540.
- ^ "Обзор ускорителей на базе FPGA для сверточных нейронных сетей", NCAA, 2018
- ^ Кейд Мец (18 мая 2016 г.). «Google создал свои собственные чипы для работы своих AI-ботов». Проводной.
- ^ «Масштабирование алгоритмов обучения в сторону {AI} - LISA - Публикации - Aigaion 2.0». www.iro.umontreal.ca.
- ^ Солнце и Книжник (1990)
- ^ Тахмасеби; Хезархани (2012). «Гибридный нейросети-нечеткая логико-генетический алгоритм для оценки успеваемости». Компьютеры и науки о Земле. 42: 18–27. Bibcode:2012CG ..... 42 ... 18 т. Дои:10.1016 / j.cageo.2012.02.004. ЧВК 4268588. PMID 25540468.
Библиография
- Бхадешия Х. К. Д. Х. (1999). «Нейронные сети в материаловедении» (PDF). ISIJ International. 39 (10): 966–979. Дои:10.2355 / isijinternational.39.966.
- Епископ, Кристофер М. (1995). Нейронные сети для распознавания образов. Кларендон Пресс. ISBN 978-0198538493. OCLC 33101074.
- Боргельт, Кристиан (2003). Neuro-Fuzzy-Systeme: von den Grundlagen künstlicher Neuronaler Netze zur Kopplung mit Fuzzy-Systemen. Vieweg. ISBN 9783528252656. OCLC 76538146.
- Цибенко, Г. (2006). «Аппроксимация суперпозициями сигмоидальной функции». В ван Шуппен, Ян Х. (ред.). Математика управления, сигналов и систем. Springer International. С. 303–314. PDF
- Дьюдни, А. К. (1997). Да, у нас нет нейтронов: открывающий глаза тур по перипетиям плохой науки. Нью-Йорк: Вили. ISBN 9780471108061. OCLC 35558945.
- Дуда, Ричард О .; Харт, Питер Эллиот; Аист, Дэвид Г. (2001). Классификация паттернов (2-е изд.). Вайли. ISBN 978-0471056690. OCLC 41347061.
- Egmont-Petersen, M .; de Ridder, D .; Хандельс, Х. (2002). «Обработка изображений с помощью нейронных сетей - обзор». Распознавание образов. 35 (10): 2279–2301. CiteSeerX 10.1.1.21.5444. Дои:10.1016 / S0031-3203 (01) 00178-9.
- Fahlman, S .; Лебьер, С (1991). "Каскадно-корреляционная архитектура обучения" (PDF).
- предназначен для Национальный фонд науки, Номер контракта EET-8716324, и Агентство перспективных оборонных исследовательских проектов (DOD), Заказ ARPA № 4976 по контракту F33615-87-C-1499.
- Герни, Кевин (1997). Введение в нейронные сети. UCL Press. ISBN 978-1857286731. OCLC 37875698.
- Хайкин, Саймон С. (1999). Нейронные сети: всеобъемлющая основа. Прентис Холл. ISBN 978-0132733502. OCLC 38908586.
- Hertz, J .; Палмер, Ричард Дж .; Крог, Андерс С. (1991). Введение в теорию нейронных вычислений. Эддисон-Уэсли. ISBN 978-0201515602. OCLC 21522159.
- Теория информации, логические выводы и алгоритмы обучения. Издательство Кембриджского университета. 25 сентября 2003 г. Bibcode:2003itil.book ..... M. ISBN 9780521642989. OCLC 52377690.
- Крузе, Рудольф; Боргельт, Кристиан; Klawonn, F .; Моуэз, Кристиан; Штайнбрехер, Маттиас; Хелд, Паскаль (2013). Вычислительный интеллект: методическое введение. Springer. ISBN 9781447150121. OCLC 837524179.
- Лоуренс, Жанетт (1994). Введение в нейронные сети: дизайн, теория и приложения. Калифорнийское научное программное обеспечение. ISBN 978-1883157005. OCLC 32179420.
- Маккей, Дэвид, Дж. (2003). Теория информации, логический вывод и алгоритмы обучения (PDF). Издательство Кембриджского университета. ISBN 9780521642989.CS1 maint: ref = harv (связь)
- Мастерс, Тимоти (1994). Обработка сигналов и изображений с помощью нейронных сетей: справочник по C ++. Дж. Вили. ISBN 978-0471049630. OCLC 29877717.
- Рипли, Брайан Д. (2007). Распознавание образов и нейронные сети. Издательство Кембриджского университета. ISBN 978-0-521-71770-0.
- Siegelmann, H.T .; Зонтаг, Эдуардо Д. (1994). «Аналоговые вычисления через нейронные сети». Теоретическая информатика. 131 (2): 331–360. Дои:10.1016/0304-3975(94)90178-3. S2CID 2456483.
- Смит, Мюррей (1993). Нейронные сети для статистического моделирования. Ван Ностранд Рейнхольд. ISBN 978-0442013103. OCLC 27145760.
- Вассерман, Филип Д. (1993). Продвинутые методы нейронных вычислений. Ван Ностранд Рейнхольд. ISBN 978-0442004613. OCLC 27429729.
- Уилсон, Холзи (2018). Искусственный интеллект. Издательство Серый Дом. ISBN 978-1682178676.
внешняя ссылка
- Зоопарк нейронной сети - компиляция типов нейронных сетей
- Мозг Стилуэлла - а Поле разума эпизод с экспериментом, в котором люди действуют как отдельные нейроны в нейронной сети, которая классифицирует рукописные цифры