Ваша способность распознавать объекты замечательно. Если вы видите чашку под необычным освещением или с неожиданных направлениях, есть хороший шанс, что ваш мозг будет все-таки вычислить, что это Кубок. Такого точного распознавания объектов является одной Святой Грааль для разработчиков искусственного интеллекта, таких, как улучшение самостоятельного вождения автомобильной навигации.
При моделировании распознавания объектов приматов в зрительной коре революцию искусственных систем распознавания образов, текущего глубоко обучающих систем упрощены, и не распознать некоторые объекты, которые являются детской забавой для приматов, таких как люди.
В выводах, опубликованных в журналах Nature Неврология, Макговерн институт исследователь Джеймс Дикарло и его коллеги нашли свидетельства, что обратная связь повышает лояльность трудно распознавать объекты в приматов мозг, и что обратная связь схема также улучшает работу искусственных нейронных сетей, используемых для применений зрения.
Глубокие сверточные нейронные сети (DCNN) являются в настоящее время наиболее успешные модели точно распознавая объекты в кратчайший срок (менее 100 мс) и общая архитектура вдохновлен предстоятель брюшной визуальный поток, корковых областей, которые постепенно строить доступной и изысканным представлением просматриваемых объектов. Большинство DCNNs просты в сравнении с вентральной предстоятель поток, однако.
“В течение длительного периода времени, мы были далеки от модели понимания. Таким образом, в нашей области началась на этот квест путем моделирования визуального распознавания как прямой процесс”, — объясняет старший автор Дикарло, который также является главой МИТ отдела мозга и когнитивных наук и научным со-руководителем Центра мозг, сознание, и машины (CBMM). “Однако, мы знаем, что есть повторяющиеся анатомических связей в областях мозга, связанных с объектом признания”.
Думаю DCNNs связью, и часть зрительной системы, что первые попытки захвата объектов, как линия метро, которая идет вперед через ряд станций. Лишние, повторяющиеся сетей мозга, а не как на улицах выше, взаимосвязаны и не однонаправленным. Потому что это только занимает около 200 мс для мозга, чтобы довольно точно распознавать предмет, неясно, если эти повторяющиеся взаимосвязи в мозге какую-либо роль вообще в ядро распознавания объектов. Возможно, эти периодические соединения только в месте, чтобы сохранить визуальную систему в гармонии в течение длительного периода времени. Например, возвращение водостоки улиц помогают постепенно очистить его от воды и мусора, но не строго необходимы для быстрого перемещения людей из одного конца города в другой. Дикарло, вместе с ведущим автором и CBMM постдок Kohitij Кар задались целью проверки упускается из виду тонким роль повторных операций в быстрое распознавание визуальных объектов.
Сложные признание
Авторы сначала необходимо определить объекты, которые легко декодируются мозгом примата, но являются сложными для искусственных систем. А не пытаться догадаться, почему глубокое изучение проблемы распознавания объекта (это из-за помех на изображении? обманчивую тень?), авторы приняли непредвзятый подход, который оказался критическим.
Кар далее поясняет, что “мы поняли, что модели искусственного интеллекта на самом деле не имеют проблем с все изображения, где объект находится позади или в беспорядок. Люди пытаются угадать, почему модели Ма были оспорены оказалось сдерживает нас”.
Вместо этого, авторы представили глубокий системы обучения, а также обезьян и человека, с изображениями, самонаведения на тему «вызов изображений», где приматы могут легко распознавать объекты на этих картинках, но DCNN прямые столкнулся с проблемами. Когда они и другие, добавлены соответствующие рекуррентные методы обработки этих DCNNs, Распознавание объекта в вызов изображение вдруг стало простым.
Время обработки
Кар использованы нейросетевые методы записи с очень высокой пространственной и временной точностью, чтобы определить, являются ли эти изображения были действительно настолько тривиально для приматов. Удивительно, они нашли, что, хотя задача изображения имели первоначально, казалось детской забавой для человеческого мозга, они фактически создавали бы дополнительных нейронных время обработки (около 30 мс), предполагая, что периодические циклы работают в нашем мозге тоже.
“То, что компьютер общий видение недавно достигнуто путем укладки все больше и больше слоев на искусственные нейронные сети, эволюция добилась через структуру мозга с рекуррентными связями», — говорит Кар.
Дайан Бек, профессор психологии и сопредседатель тему интеллектуальные системы в Бекман институт и не автор исследования, объясняет. “С совершенно прямой глубоких сверточных сетей сейчас весьма хороши в прогнозировании активности мозга приматов, он поднял вопросы о роли обратных связей в головном мозге приматов. Это исследование показывает, что, да, связи обратная связь очень вероятно, играют определенную роль в признании объекта после всех”.
Что это означает для самостоятельного вождения автомобиля? Это показывает, что глубокое изучение архитектур участвует в распознавании объектов, потребуются новые компоненты, если они соответствуют мозг приматов, а также указывает, как реализовать эту процедуру для следующего поколения интеллектуальных машин.
“Текущие модели предлагают предсказания нейронной активности и поведения со временем», — говорит Кар. “Теперь мы можем моделировать более сложные задачи. Возможно, однажды, эти системы должны не только признать объект, такой как человек, но и выполнять когнитивные задачи, которые человеческий мозг так легко удается, как, например, понимание эмоций других людей”.
Эта работа была поддержана Управлением военно-морских исследований и Центром мозги, умы и машины через Национальный научный фонд.