Осуществляется поиск среди имеющихся эталонов. Если находится
эталон, который соответствует нервному паттерну, человек опознает этот
паттерн. После сопоставления объекта с его эталоном может происходить
дальнейшая обработка информации и интерпретация объекта.
Сравнение с эталоном как одна из теорий распознавания паттернов
имеет свои сильные и слабые стороны. С положительной стороны, кажет-
ся очевидным, что для опознания некоторой фигуры, например, буквы или
какой-нибудь визуальной формы, нужен определенный контакт с соответ-
ствующей внутренней формой. На каком-то уровне абстракции для опоз-
нания объекта "внешней реальности" необходимо, чтобы он был представ-
лен в долговременной памяти. С другой стороны, буквальная интерпрета-
ция теории сравнения с эталоном встречается с определенными трудно-
стями. Например, если опознание возможно только тогда, когда между
"внешним" объектом и его "внутренней" репрезентацией имеется соот-
ветствие 1:1, то это значит, что даже при незначительном расхождении
между объектом и его эталоном опознания не произойдет. Поэтому стро-
гое следование этой теории означало бы необходимость формирования
несчетного количества эталонов, соответствующих каждой из разнообраз-
ных геометрических форм, которые мы видим и узнаем.
Легкость, с которой мы распознаем зрительные образы в повседневной
жизни, может навести на мысль, что это очень простой процесс, и все же,
Рис. 3.4. Кривые
ответов испытуемо-
го в исследовании
влияния контекста.
По горизонтали:
А- соответствую-
щий контекст; N-
нет контекста; "Is"-
несоответствующий
контекст, сходный
объект; и Ib-не-
соответствующий
контекст, непохо-
жий объект. Адапти-
ровано из: Ru-
melhart (1977J по
данным Palmer
11975Ь1.
Сравнение с
эталоном
Распознавание паттернов
85
когда мы пытаемся воспроизвести опознание с помощью искусственных
средств, то оказывается, что результат от нас ускользает. Возьмем для
примера опознание букв и устройство для распознавания слов. Чтобы на-
учиться хорошо читать, нужно потратить несколько лет, но когда мы на-
учились распознавать орфографическую конфигурацию, составляющую
слово, мы можем мгновенно узнать это слово в различных контекстах,
произнести его и вспомнить его значение. Как бы вы смоделировали ис-
ходный процесс опознания буквы на компьютере? Один из способов -
это хранить в "памяти" компьютера каждую из 26 букв. Тогда каждый раз,
когда буква сканировалась бы оптическим устройством, воспринимаемая
зрительная конфигурация "настраивалась" бы на элемент памяти (эта-
лон), связанный с этой буквой. Так, слово CARD (карточка) анализирова-
лось бы как C-A-R-D, т.е. "С" настраивалось бы на ячейку памяти, соот-
ветствующую конфигурации "С", для "А" нашлось бы соответствие в ячейке
"А" и т.д. "Вуа-ля! - мог бы воскликнуть компьютер,- а я читаю буквы!"
Но что если бы мы попросили его опознать буквы в слове "card"? В его
памяти нет конфигураций для написания букв в нижнем регистре. Реше-
ние просто, скажете вы: увеличьте память и включите туда буквы нижне-
го регистра. Но тогда мог бы наш компьютер прочитать (как это делаем
мы) буквы, написанные вот так:
ОРдСГили так Obdили так 0гд/или так Су1й)
Конечно же, в чтении участвуют гораздо более сложные процессы, чем
простое опознание букв. Прием, используемый в компьютерной техни-
ке,- сравнение конфигурации букв с конкретными конфигурациями в
памяти машины - называется "сравнение с эталоном"; это похоже на
поворот ключа в замке. Чтобы открыть замок, конфигурация бороздок Ь
выемок на ключе должна совпасть с конфигурацией замка. На языке рас-
познавания образов при сравнении с эталоном происходит следующее:
когда зрительная конфигурация соответствует совместимой с ней репре-
зентации в памяти, информация высвобождается. Как видно из примера с
компьютером, метод сравнения с эталоном встречается с трудностями при
попытке опознать слово "CARD", если в его написании есть какие-либо
отклонения,- это все равно, что пытаться открыть замок погнутым клю-
чом.
Таким образом, сравнение с эталоном - это элементарная процедура
распознавания паттернов, основанная на том, что конфигурация сенсор-
ной информации точно подходит к соответствующей "конфигурации" в
памяти; и хотя ее возможности ограничены, она имеет определенное тео-
ретическое и практическое значение. Теоретические вопросы, связанные
с этим методом, мы затронем позднее. Что касается его практических
применений, то они весьма многочисленны.
Итак, в случае распознавания паттернов человеком "жесткое" следо-
вание этой модели привело бы к необходимости создания миллионов от-
дельных шаблонов, каждый из которых соответствовал бы отдельному
зрительному паттерну. Если бы нам приходилось хранить так много этало-
нов, наш мозг был бы таким громоздким, что пришлось бы возить его на
тачке. Так что этот трюк не пройдет по неврологическим соображениям.
Обнаружение и интерпретация сенсорных сигналов
в компьютерах
Сравнение с эталоном является основой
многих кодирующих систем, ставших час-
тью нашей повседневной жизни. Например,
; почти все банки в США имеют системы
цену, печатаемую затем на контрольной
ленте кассового аппарата.)
А
1пет|сдг|
STATE
BANK
Mattew A. SWANN
18 Chclsca Place
New York, N.Y. 100П
HO. 159
PAY TO ME ORDER OF _
OTV-- Ю№ 75 47 Д>
Цдля идентификации счетов по специальным
Вб цифрам, отпечатанным на оборотной сто-
,роне чека, а во многих магазинах исполь-
зуютсн аналогичные коды (напечатанные
,У; на упаковках товара) для ускорения про-
|цесса выписки счетов и проведения пере-
йучета товаров. (По этому коду компьютер
% определяет единицу товара и указывает ее
Обе эти разновидности кодов читаются
посредством сравнения с эталоном. Рису-
нок на чеке имеет отличительные детали,
помогающие компьютеру различать буквы,
а торговые коды читаются по положению
линий, их ширине и пространству между
ними. Коды преобразуются сканером в
электрические импульсы, из которых со-
ставляется сигнальный паттерн; последний
передается в компьютер, идентифицирую-
щий этот паттерн путем сравнения его с
аналогом (эталоном), находящимся в его
памяти.
Но даже если бы это было возможно, то для доступа к памяти, где хранят-
ся многие миллионы эталонов, потребовалась бы процедура поиска, зани-
мающая крайне много времени, что никак не соответствует нашей способ-
ности быстро опознавать множество различных паттернов. Наконец, эта
модель маловероятна потому, что мы можем опознавать незнакомые фор-
мы и фигуры (например, новые варианты начертания буквы "А").
Еще один подход к проблеме извлечения информации из сложных стиму- Подеталь-
лов - это подетальный анализ.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200
эталон, который соответствует нервному паттерну, человек опознает этот
паттерн. После сопоставления объекта с его эталоном может происходить
дальнейшая обработка информации и интерпретация объекта.
Сравнение с эталоном как одна из теорий распознавания паттернов
имеет свои сильные и слабые стороны. С положительной стороны, кажет-
ся очевидным, что для опознания некоторой фигуры, например, буквы или
какой-нибудь визуальной формы, нужен определенный контакт с соответ-
ствующей внутренней формой. На каком-то уровне абстракции для опоз-
нания объекта "внешней реальности" необходимо, чтобы он был представ-
лен в долговременной памяти. С другой стороны, буквальная интерпрета-
ция теории сравнения с эталоном встречается с определенными трудно-
стями. Например, если опознание возможно только тогда, когда между
"внешним" объектом и его "внутренней" репрезентацией имеется соот-
ветствие 1:1, то это значит, что даже при незначительном расхождении
между объектом и его эталоном опознания не произойдет. Поэтому стро-
гое следование этой теории означало бы необходимость формирования
несчетного количества эталонов, соответствующих каждой из разнообраз-
ных геометрических форм, которые мы видим и узнаем.
Легкость, с которой мы распознаем зрительные образы в повседневной
жизни, может навести на мысль, что это очень простой процесс, и все же,
Рис. 3.4. Кривые
ответов испытуемо-
го в исследовании
влияния контекста.
По горизонтали:
А- соответствую-
щий контекст; N-
нет контекста; "Is"-
несоответствующий
контекст, сходный
объект; и Ib-не-
соответствующий
контекст, непохо-
жий объект. Адапти-
ровано из: Ru-
melhart (1977J по
данным Palmer
11975Ь1.
Сравнение с
эталоном
Распознавание паттернов
85
когда мы пытаемся воспроизвести опознание с помощью искусственных
средств, то оказывается, что результат от нас ускользает. Возьмем для
примера опознание букв и устройство для распознавания слов. Чтобы на-
учиться хорошо читать, нужно потратить несколько лет, но когда мы на-
учились распознавать орфографическую конфигурацию, составляющую
слово, мы можем мгновенно узнать это слово в различных контекстах,
произнести его и вспомнить его значение. Как бы вы смоделировали ис-
ходный процесс опознания буквы на компьютере? Один из способов -
это хранить в "памяти" компьютера каждую из 26 букв. Тогда каждый раз,
когда буква сканировалась бы оптическим устройством, воспринимаемая
зрительная конфигурация "настраивалась" бы на элемент памяти (эта-
лон), связанный с этой буквой. Так, слово CARD (карточка) анализирова-
лось бы как C-A-R-D, т.е. "С" настраивалось бы на ячейку памяти, соот-
ветствующую конфигурации "С", для "А" нашлось бы соответствие в ячейке
"А" и т.д. "Вуа-ля! - мог бы воскликнуть компьютер,- а я читаю буквы!"
Но что если бы мы попросили его опознать буквы в слове "card"? В его
памяти нет конфигураций для написания букв в нижнем регистре. Реше-
ние просто, скажете вы: увеличьте память и включите туда буквы нижне-
го регистра. Но тогда мог бы наш компьютер прочитать (как это делаем
мы) буквы, написанные вот так:
ОРдСГили так Obdили так 0гд/или так Су1й)
Конечно же, в чтении участвуют гораздо более сложные процессы, чем
простое опознание букв. Прием, используемый в компьютерной техни-
ке,- сравнение конфигурации букв с конкретными конфигурациями в
памяти машины - называется "сравнение с эталоном"; это похоже на
поворот ключа в замке. Чтобы открыть замок, конфигурация бороздок Ь
выемок на ключе должна совпасть с конфигурацией замка. На языке рас-
познавания образов при сравнении с эталоном происходит следующее:
когда зрительная конфигурация соответствует совместимой с ней репре-
зентации в памяти, информация высвобождается. Как видно из примера с
компьютером, метод сравнения с эталоном встречается с трудностями при
попытке опознать слово "CARD", если в его написании есть какие-либо
отклонения,- это все равно, что пытаться открыть замок погнутым клю-
чом.
Таким образом, сравнение с эталоном - это элементарная процедура
распознавания паттернов, основанная на том, что конфигурация сенсор-
ной информации точно подходит к соответствующей "конфигурации" в
памяти; и хотя ее возможности ограничены, она имеет определенное тео-
ретическое и практическое значение. Теоретические вопросы, связанные
с этим методом, мы затронем позднее. Что касается его практических
применений, то они весьма многочисленны.
Итак, в случае распознавания паттернов человеком "жесткое" следо-
вание этой модели привело бы к необходимости создания миллионов от-
дельных шаблонов, каждый из которых соответствовал бы отдельному
зрительному паттерну. Если бы нам приходилось хранить так много этало-
нов, наш мозг был бы таким громоздким, что пришлось бы возить его на
тачке. Так что этот трюк не пройдет по неврологическим соображениям.
Обнаружение и интерпретация сенсорных сигналов
в компьютерах
Сравнение с эталоном является основой
многих кодирующих систем, ставших час-
тью нашей повседневной жизни. Например,
; почти все банки в США имеют системы
цену, печатаемую затем на контрольной
ленте кассового аппарата.)
А
1пет|сдг|
STATE
BANK
Mattew A. SWANN
18 Chclsca Place
New York, N.Y. 100П
HO. 159
PAY TO ME ORDER OF _
OTV-- Ю№ 75 47 Д>
Цдля идентификации счетов по специальным
Вб цифрам, отпечатанным на оборотной сто-
,роне чека, а во многих магазинах исполь-
зуютсн аналогичные коды (напечатанные
,У; на упаковках товара) для ускорения про-
|цесса выписки счетов и проведения пере-
йучета товаров. (По этому коду компьютер
% определяет единицу товара и указывает ее
Обе эти разновидности кодов читаются
посредством сравнения с эталоном. Рису-
нок на чеке имеет отличительные детали,
помогающие компьютеру различать буквы,
а торговые коды читаются по положению
линий, их ширине и пространству между
ними. Коды преобразуются сканером в
электрические импульсы, из которых со-
ставляется сигнальный паттерн; последний
передается в компьютер, идентифицирую-
щий этот паттерн путем сравнения его с
аналогом (эталоном), находящимся в его
памяти.
Но даже если бы это было возможно, то для доступа к памяти, где хранят-
ся многие миллионы эталонов, потребовалась бы процедура поиска, зани-
мающая крайне много времени, что никак не соответствует нашей способ-
ности быстро опознавать множество различных паттернов. Наконец, эта
модель маловероятна потому, что мы можем опознавать незнакомые фор-
мы и фигуры (например, новые варианты начертания буквы "А").
Еще один подход к проблеме извлечения информации из сложных стиму- Подеталь-
лов - это подетальный анализ.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200