Как работает нейронная сеть
Нейронная сеть представляет собой определенную последовательность нейронов, которые соединяются друг с другом синапсами. Структуру данной сети программирование позаимствовало у биологии. Именно благодаря ей, машина получает способность к анализированию и запоминанию разнообразной информации.
Нейронные сети умеют воспроизводить полученные данные из памяти. Можно сказать, что подобная сеть – компьютерная интерпретация человеческого мозга с миллионами нейронов, обеспечивающих передачу данных в виде электрических импульсов. Ранее мы рассказывали о внедрении нейронных сетей в работу Google Translate для русского языка.
Существуют нейронные сети:
- прямого распространения – с последовательной связью нейронных слоев, где
- данные постоянно идут в одном лишь направлении;
- рекуррентные.
Для чего используются нейронные сети
Нейронные сети помогают решить задачи высокой сложности, требующие аналитических вычислений. Наиболее распространенное использование:
- классификация – распределение полученной информации по параметрам;
- предсказание – способность благодаря анализу предугадывать следующий шаг;
- распознавание – применяется наиболее широко (например, в поиске фото Google или в камерах телефонов).
Из чего состоит нейронная сеть
Нейрон является вычислительной единицей, получающей данные, производящей над ними простые вычислительные действия и передающей их дальше.
Существует 3 основных вида:
- входной;
- скрытый;
- выходной.
Если нейронов в сети много, вводится термин «слоя». Каждый нейрон имеет 2 главных показателя:
- входные данные – input data;
- выходные данные – output data.
Нейроны оперируют числами в конкретном диапазоне [0,1] или же [-1,1]. Когда необходима обработка чисел, не входящих в этот диапазон, она происходит при помощи процесса нормализации.
Синапс обеспечивает связь между 2-мя нейронами.
Он имеет всего 1 показатель – вес, с помощью которого при переходе между нейронами входные данные изменяются. Когда происходит инициализация нейронной сети, расстановка весов имеет случайный порядок.
Терминология и свойства нейронной сети
- Функция активации – процесс нормализации входной информации. Главными функциями активации являются линейная функция, сигмоид (или логистическая функция) и гиперболический тангенс. Отличаются они диапазоном значений.
- Тренировочный сет – определенная последовательность данных в нейросети, которыми она оперирует.
- Итерация – так называемый счетчик, увеличивающийся, когда нейросеть проходит 1 тренировочный сет. Можно сказать, это общая численность данных сетов, которые прошла сеть.
- Эпоха – величина, которая при инициализации нейронной сети должна иметь значение 0. Верхняя граница задается вручную. Большой показатель эпохи означает, что сеть хорошо натренирована и выдает лучший результат. Нельзя путать с эпохой итерацию.
- Ошибка – процентная величина, показывающая расхождение между тем ответом, который ожидался, и полученным. 3 основных метода, помогающие вычислить ошибку: Mean Squared Error (MSE), Arctan и Root MSE.