본문 바로가기

23년 1학기 학교공부/영상처리

(8)
[IP] Compression(압축) 이미지와 비디오는 크기가 크므로, 저장이나 파일 교환을 위해서는 Compression(압축)이 필수적이다. Compression에는 두 가지 다른 방법이 있다. 1. 모든 정보를 남기는 Lossless 압축 2. 어느정도 정보의 손실이 생기는 Lossy 압축 📁 Huffman Coding 가장 빈번한 정보에 더 짧은 비트를 할당해라. 픽셀 당 비트의 평균 개수는 확률론적 의미에서 기댓값과 같다. 정보의 손실 없이 이미지를 인코드하기 위한 픽셀 당 이론적인 최소 비트 수를 Entropy H라고 한다. 절차는 다음과 같다. 영상에서 각 gray value의 확률을 결정한다, 즉 히스토그램을 작성한다. 가장 낮은 확률 두 개를 추가하여 binary tree를 만든다. 루트에서 트리의 각 분기에 0과 1을 임의..
[IP] Segmentation 📁 Segmentation 이미지에서 비슷한 정보들을 겹치지 않는 영역으로 나누는 것을 image segmentation이라고 한다. 가장 기본적인 접근 방법은 thresholding이다. 📁 ThresHolding Thresholding은 어느 픽셀값을 기준으로 모든 픽셀을 하얀색 혹은 검은색으로 바꾸는 작업이다. 픽셀값의 기준이 한개일 때는 single thresholding, 두개일때는 double thresholding이라고 한다. Thresholding으로 이미지에서 잘 보이지 않던 부분들도 눈에 잘 보이게 드러낼 수 있다. thresholding을 사용하여 바탕의 noise를 제거하고 텍스트만 추출할 수 있다. thresholding 전에 이미지에 smoothing filter를 적용하면 이처..
[IP] Morphological 📁Binary Images Binary Image란, 이미지 전체를 0과 1로 표현한 이미지를 말한다. 보통 알파벳 B로 이미지를 표현한다. B[r, c]는 binary image B의 row r, column c번째 픽셀을 말한다. B[r, c] = 1이면 [r, c]는 foreground pixel, black pixel이라고 말하고 B[r, c] = 0이면 [r, c]는 background pixel, white pixel이라고 말한다 binary image의 값은 intensity와 반대이다. 보통 HEX값과 같이 색을 값으로 나타낼때는 0에 가까워질수록 검정색, 1에 가까워질수록 하얀색이지만 binary image에서는 단순히 칠해져있으면 1, 아니면 0으로 가정한다. 📁 Neighborhood..
[IP] Edge Detection 📁 Edge Detection 이미지의 갑작스러운 불연속적 변화를 식별함으로써 Edge를 감지하고자 한다. Edge만 나타내도 이미지 대부분의 모양 정보를 알 수 있다. Edge는 다양한 요소에 의해 결정된다. 하나의 이미지에 위처럼 다양한 Edge가 존재한다. Edge는 이미지의 intensity function에서 급격한 변화가 나타나는 지점에 존재한다. intensity는 흑백 이미지에서는 픽셀값이므로, intensity function은 왼쪽 image의 빨간선을 따라서 픽셀을 나열한 함수이고, 이 함수에서 급격한 변화가 나타나는 지점은 곧 픽셀값이 급격하게 변하는 부분이다. intensity function을 1차 미분하면 edge를 찾는데 유용한 정보를 얻을 수 있다. 오른쪽 1차 미분 함수에..
[IP] Image Downsampling 📁 Naïve image downsampling 가장 기본적으로 나이브한 다운샘플링 방법이 있다. 짝수번째 row와 짝수번째 column을 삭제하여 각 행열의 개수를 1/2배하는 방법이다. 이때 1/2, 1/4, 1/8 등 축소 비율은 기존 가로 혹은 세로 길이에 비해 결과 이미지의 길이가 얼마나 짧아졌는지를 뜻한다. 즉 넓이 기준에서는 1/4배씩 축소되는 것이다. 위와 같이 Naïve image downsampling 방식으로 축소시킨 이미지를 다시 확대시키면, 축소 비율이 높을수록 더 pixelated된다. 📁 Sampling(표본화) 일정한 간격으로 데이터를 뽑아내는것을 Sampling이라고 한다. 영상 및 이미지에서는 일정한 기준으로 pixel을 획득하는 것을 뜻한다. 간단한 예시인 sine 함수..
[IP] Image Filtering 📁 Image Filtering Image Filtering이란, 각 위치에서 특정 지역 안의 이웃 요소들을 계산하는 기능을 말한다. 대부분의 필터링은 이런식으로 동작한다. 특정 크기의 mask를 정의하고, mask와 이미지를 대응시켜 곱한 픽셀값들을 더한것이 현재 픽셀위치 값이 된다. 이를 수식으로 나타내면 다음과 같다. 구체적인 과정은 아래에서 확인할 수 있다. 📁 Linear filter(선형 필터) 📁 Average Filter(평균 필터) 위와 같은 9칸 박스 필터 g가 있다고 하자. f는 원본이미지, h는 결과이미지이다. mask의 크기가 9칸이므로 f에서도 9칸의 범위를 잡는다. 이후 mask와 f의 9칸 범위를 대응시켜, 같은 위치에 있는 픽셀값을 서로 곱한 후 더한다. 즉 0 x 1/9 ..
[IP] Pixel-wise operation 📁 Pixel-wise operation Pixel-wise operation이란, 주변 픽셀을 이용하지 않고 자신의 픽셀만 Processing(변화)시키는 것을 말한다. point processing, point operations이라고도 부른다. 주변 픽셀값을 고려하여 자신의 픽셀을 변화시키는 Neighborhood Processing과 반대되는 개념이다. 예시는 다음과 같다. 📁 Arithmetic Operation pixel intensity(화소 강도)란 해당 픽셀의 밝은 정도를 나타내며, gray level(회색도)이라고도 불린다. 만약 이미지가 gray image라면, 픽셀의 value(값)이 곧 intensity인것이다. 이미지가 color image라면, 픽셀은 intensity, coo..
[IP] Image fundamentals 📁 Image digital image란 픽셀들의 집합이고, 즉 픽셀은 디지털 이미지 안에서 가장 작은 유닛이다. 픽셀은 픽셀 좌표(pixel coordinate)와 픽셀 값(pixel value)으로 이루어져있다. 픽셀 좌표는 이산적(discrete), 불연속적이다. 이미지의 모든 곳에 픽셀이 존재하는 것이 아니라, (정수 x 정수) 위치에만 있기 때문이다. 픽셀 값 또한 이산적(discrete), 불연속적이다. 픽셀 값은 밝기나 색상 등을 표현하는 값으로, 우리가 다루는 이미지에서는 0 ~ 255 범위의 정수 값으로 조건이 정해져있다. 이미지는 대중적으로 2차원 함수 f(x, y)라고 표현하며, (x, y) 형태로 좌표를 표현한다. gray image는 1-D scalar값을 나타내고, color i..