목록Machine Learning/CV (4)
elevne's Study Note

저번에 EasyOCR을 알아본데에 이어서, 이번에는 이미지 내 객체의 윤곽선을 바탕으로 이미지를 추출해내는 방법과, 그 이미지에 EasyOCR을 적용하는 것을 실습해보았다. 우선 필요한 라이브러리들을 Import 해준다. from matplotlib import pyplot as plt from imutils.perspective import four_point_transform from imutils.contours import sort_contours import imutils from easyocr import Reader import cv2 import requests import numpy as np from PIL import ImageFont, ImageDraw, Image OpenCV는 O..

저번에는 CRNN을 이용해서 OCR을 진행하는 법에 대해 알아보았다. 이번에는 단순 OCR이 아닌 Scene Text Detection을 진행하기 위해 사용되는 EAST, CRAFT 모델에 대해 알아보고 이를 EasyOCR을 활용하여 코드로 실습해보았다. Scene Text Detection / Recognition은 일상적인 풍경 이미지에서 글자가 있는 영역을 탐지하고 이를 컴퓨터 문자로 변환하는 문제를 뜻한다. Traditional OCR은 배경이 단순, 글씨체는 규칙적, 글자배열은 수평적, 색은 단조롭다. 하지만 Scene Text 문제는 이보다 훨씬 복잡하다. 이미지의 배경은 복잡하며 글씨체도 다양하고, 글자배열의 각도 및 구도가 다양하며 색도 다채롭게 사용되어 있다. Scene Text Dete..

Object Detection은 이미지에서 특정 물체의 부분을 검출해내는 것을 말한다. Object Detection 모델을 사용하게 되면 결과값으로 6가지의 값이 나오게된다. x_min, x_max, y_min, y_max 값 4개가 우선 반환되는데, 이는 Object가 있는 Bounding Box의 범위를 알려주는 값들이다. 또, 그 Bounding Box 내에 속한 물체의 Class 값이 반환되고, 그 확신의 정도를 나타내는 Confidence 값이 반환된다. 참고로 Object Detection과 유사하게 Segmentation이라는 분야도 있는데, 이는 Bounding Box가 아닌 Pixel 단위로 Detection을 수행하는 것이다. 사진으로 그 둘을 비교하자면 아래와 같다. Detectio..

OCR(Optical Character Recognition): Text Detection이 수행된 Bounding Box 내에 존재하는 글자가 어떤 글자인지를 인식하는 문제영역 이 OCR 분야는 Structed Text, Unstructed Text 두 분야로 또 나뉜다. Structed Texts는 신문처럼 이미 정형화된 형식으로 되어있는 데이터에서 글자를 인식하는 것이고, Unstructed Text는 사진 속 간판에 있는 글을 인식하는 것처럼, 동일 형식이 아닌 곳에서 글자를 인식해야 하는 분야이다. 이번에는 Unstructed Text 분야의 License Plate Recognition, 차량 번호판 인식 모델을 실습해볼 예정이다. 이는 Text Detection과 OCR이 둘 다 필요한 분야..