Техническа визия на роботите
За да се класифицират методите и подходите, използвани в системите за зрение, зрението се разделя на три основни подкласа: ниско, средно и високо зрение. Системите за ниско ниво на зрение са проектирани да обработват информация от сензорни сензори.
Тези системи могат да бъдат причислени към класа на "интелигентните" машини, ако имат следните характеристики (признаци на интелигентно поведение):
1) способността да се извлича съществена информация от множество независими характеристики;
2) способността да се учат от примери и да обобщават тези знания, за да ги прилагат в нови ситуации;
3) възможността за възстановяване на събития от непълна информация;
4) способността да се определят цели и да се формулират планове за постигане на тези цели.
Системите за техническо зрение на средно ниво са свързани със задачите за сегментиране, описание и разпознаване на отделни обекти. Тези задачи обхващат много подходи, базирани на аналитични представяния. Системите за зрение от високо ниво решават проблемите, обсъдени по-горе. За по-ясно разбиране на проблемите на техническото зрение от високо ниво и връзката му с техническото зрение от ниско и средно ниво, ние въвеждаме редица ограничения и опростяваме проблема, който се решава.
2. СЕГМЕНТАЦИЯ
Сегментирането е процес на подразделяне на сцена на съставни части или обекти. Сегментирането е един от основните елементи на работата на автоматизирана система за зрение, тъй като именно на този етап от обработката обектите се отделят от сцената за по-нататъшно разпознаване и анализ. Алгоритмите за сегментиране обикновено се основават на два основни принципа: прекъсване и сходство. В първия случайосновният подход се основава на дефинирането на контури, а във втория - на дефинирането на праговото ниво и разширяването на площта. Тези концепции се прилагат както за статични, така и за динамични (зависещи от времето) сцени. В последния случай движението може да бъде мощен инструмент за подобряване на производителността на алгоритмите за сегментиране.
Методи - изчисляване на градиента, разделяне на прага - определят пропуските в интензитета на представяне на изображението на обекта. В идеалния случай тези методи определят пикселите, които лежат на границата между обекта и фона. На практика даден ред от пиксели рядко напълно характеризира ръба поради шум, прекъсвания на ръба поради неравномерно осветяване и други ефекти на замъгляване. По този начин алгоритмите за откриване на ръбове се придружават от процедури за конструиране на граници на обекти от съответните последователности от пиксели. По-долу са разгледани няколко метода, подходящи за тази цел.
Един от най-простите подходи за свързване на крайни точки е да се анализират характеристиките на пикселите в малък квартал (например квартал 3 X 3 или 5 X 5) на всяка точка(x,y)от изображението, което вече е преминало през процедурата за откриване на контури. Всички точки, които са сходни (определението на критерия за сходство е дадено по-долу) са свързани, образувайки граница от пиксели, които имат някои общи свойства.
С този анализ, за да се установи сходството на контурните пиксели, е необходимо да се определи:
1) стойността на градиента, необходима за изграждане на контурния пиксел,
2) посоката на градиента.
Първата характеристика се обозначава със стойносттаGy)].
По този начин, контурният пиксел с координати(x', y')е подобен по размер в предварително дефинирания квартал(x,y)към пиксела с координати (x,y),ако неравенството е вярно
къдетоT—прагова стойност.
Посоката на градиента се задава от ъгъла на вектора на градиента, определен в уравнението
където q е ъгълът (по отношение наx ос),, по който скоростта на промяна има най-голяма стойност. Тогава можем да кажем, че ъгълът на пиксела на контура с координатиx', y')в някакъв квартал (x,y)е подобен на ъгъла на пиксела с координатиx, y), когато е изпълнено следното неравенство:
къдетоA—е праговата стойност на ъгъла. Трябва да се отбележи, че посоката на контура в точкатаx, y)всъщност е перпендикулярна на посоката на градиентния вектор в тази точка. Въпреки това, за сравнение на посоките, неравенството дава еквивалентни резултати.
Въз основа на тези предположения, ние свързваме точка в някакъв квартал(x, y) спиксел с координати(x, y),, ако критериите за величина и посока са изпълнени. Придвижвайки се от пиксел към пиксел и представяйки всяка прикрепена точка като център на квартала, процесът се повтаря за всяка точка от изображението. Стандартна библиотечна процедура се използва за картографиране на нивата на интензитета на светлината към контурните последователности от пиксели.
Целта е да определите размерите на правоъгълниците, с които да изградите качествено изображение. Изграждането на такива правоъгълници се извършва в резултат на дефинирането на строго хоризонтални и вертикални контури. По-нататъшният процес се състоеше в свързване на сегменти от контура, разделени с малки празнини, и в комбиниране на отделни къси сегменти.
Помислете за метода за свързване на гранични точки, като определите тяхното местоположение върхукрива от специален вид. Първоначално, ако приемем, че са дадениnточки в равнинатаxyна изображението, се изисква да се намерят подпоследователности от точки, лежащи на прави линии. Едно възможно решение е да се начертаят всички линии, минаващи през всяка двойка точки, и след това да се намерят всички подпоследователности от точки, които са близо до определени линии. Проблемът, свързан с тази процедура, е да се намериn(n-1)/2
n3сравнения на всяка точка с всички линии. Този процес е трудоемък от изчислителна гледна точка, с изключение на най-простите приложения.
Този проблем може да бъде решен по друг начин, като се използва подходът, предложен от Hoag и нареченТрансформация на Hoag. Да разгледаме точка (x i y i ) и общото уравнение на права линияy: = axi+bi .записваме това уравнение във форматаb =-хiа+yiи разглеждаме равнинатааb (пространство на параметри),тогава имаме уравнениетоедноред за фиксирана двойка числа (х i yi ). Освен това втората точка(xj ,yj )също има права, свързана с нея в пространството на параметрите, която пресича друга права, свързана с точката (хi yi ) в точката(а', b’),,yj )в равнинатаxy.Всъщност всички точки, разположени на тази линия в пространството на параметрите ще има пресечни линии в точката (a',b').
Изчислителната привлекателност на трансформацията на Хоуг се крие вразделяне на пространството от параметри на така нареченитесъбиращи елементи, където (amax,амин)и (bmax, bm in) са допустимите стойности на параметрите на линията. Събиращ елементA (i, j)съответства на областта, свързана с координатите на пространството на параметрите (a i,bj).Първоначално тези елементи се приемат за нула. След това за всяка точка(xk ,yk ) вравнината на изображението задаваме параметър a равен на всяка от разрешените стойности по остаaи изчисляваме съответните b,като използваме уравнениетоb= -xk+ykстойности на осb.Ако изборът на aр води до изчисляване на b q,задавамеA( p,q) == A( p,q)+ 1. След завършване на тази процедура, стойносттаMв елементаA (i, j)съответства наMточки в равнинатаxy,лежащ на праватаy=ai x+b.Точността на местоположението на тези точки на една права зависи от броя на дяловете на равнинатааb.Обърнете внимание, че ако разделим оста a наKчасти, тогава за всяка точка(xk ,yk )получавамеKстойности b,съответстващи наKвъзможни стойности на a . Тъй като имаnточки на изображението, процесът се състои отpKизчислителни операции. Следователно, горната процедура е линейна по отношение наnи има по-малко изчислителни операции от описаната по-горе процедура, акоK