본문 바로가기

DeepLearning

(16)
[KR_OCR] 한국어데이터셋(imageWIthBox) AI HUB에서 제공한 데이터를 바탕으로 GTUtilily와 pickle 파일을 생성한 뒤, 텍스트박스가 잘 어노테이션 되어있는지 확인 하는 작업을 진행한다. 1. Loading Library import matplotlib.pyplot as plt import PIL import pickle import os import cv2 import numpy as np from data_KSign import GTUtility - 한국어 데이터셋으로 만든 GTUtility를 import 한다 2. Making Function def getTextbox(data_path = 'data/K-Sign', su = 2, quality = 'high'): if quality == 'high': gt_util = GTU..
[KR_OCR] 한국어학습을 위한 라벨 라벨 값이 알파벳 대문자와 소문자로 구성된 영어와 달리 새로운 라벨이 필요 학습에 사용하는 데이터를 활용하여 Label_dictionary 생성 1. K-Sign Data(AI HUB) 지난번에 AI HUB에서 다운로드한 어노테이션을 활용하여 Dict 생성 1> K-Sign데이터로 GTUtility 객체 생성 from data_KSign import GTUtility gt_util = GTUtility('data/K-Sign/HighQuality/', quality='high') - 앞 포스팅에서 만든 GTUtility를 사용하여 객체 생성하기 2> 생성된 객체의 text값 가져오기 text = gt_util.text - 생성 된 객체의 .text 안에 학습에 사용하는 이미지 데이터의 text값이 담겨져..
[KR_OCR] 한국어 데이터셋(AI HUB) 기본적인 CRNN의 구조에 대한 파악이 끝난 후에 한국어 인식을 위한 한국어 데이터 셋을 사용하기 위한 준비. Korea Sign Datasets OCR 인식을 위한 한국 표지판 데이터 셋을 다운 - 어노테이션이 포함된 파일로 다운로드한다 - 데이터 다운로드 링크 : http://www.aihub.or.kr AI 오픈 이노베이션 허브 AI 챗봇,안면인식 등 지능형 서비스 구현에 활용할 수 있는 지식베이스와 기계학습용 이미지 데이터를 제공합니다. www.aihub.or.kr >> 위의 주소로 들어가서 관광 카테고리에 가면 한국 표지판 데이터를 다운로드할 수 있다. >> 다운로드한 뒤 압축을 푼 상태에서 'data/K-sign/' 경로 아래로 데이터를 넣는다 ( 위 경로 아래에는 크롤링 데이터 / 고해상도 ..
[ENG_OCR] ImageWithTextBoxes 디버깅을 위한 코드 CRNN 학습 도중에 에러가 나는 이미지에 대해 시각적으로 보기 위해 만든 코드 그 외에도 데이터셋의 형태 파악에 사용 가능 1. Image와 함께 Annotation된 라벨 값 시각화 작업 1> 필요한 라이브러리 로딩 import matplotlib.pyplot as plt import PIL import pickle import os import cv2 import numpy as np 2> 피클파일 불러오기 from data_cocotext import GTUtility with open('gt_util_cocotext_val.pkl', 'rb') as f: gt_util_val = pickle.load(f) 3> 확인하고 싶은 특정이미지의 인덱스 확인. idx = gt_util_val.image_..
[ENG_OCR] CRNN_Training 모델 학습 프로세스 아래에서 진행되는 코드는 아래 깃허브를 기본 베이스로 사용하였습니다:) https://github.com/mvoelk/ssd_detectors mvoelk/ssd_detectors SSD-based object and text detection with Keras, SSD, DSOD, TextBoxes, SegLink, TextBoxes++, CRNN - mvoelk/ssd_detectors github.com CRNN_Train.py 1> 필요한 라이브러리 로딩 import numpy as np import matplotlib.pyplot as plt import os import editdistance import pickle import ti..
[ENG_OCR] CRNN_cocotext 데이터 전처리 작업 Datasets : COCO/Train2014 Annotations : COCO_Text.json https://vision.cornell.edu/se3/coco-text-2/ COCO-Text: Dataset for Text Detection and Recognition | SE(3) Computer Vision Group at Cornell Tech COCO-Text: Dataset for Text Detection and Recognition The COCO-Text V2 dataset is out. Check out our brand new website! Check out the ICDAR2017 Robust Reading Challenge on COCO-Text! COCO-Text is a n..
[OCR] CRNN Model_기본 구조 backbone 역할을 하는 함수 : 논문에서 언급한 대로 VGG-16 모델 구현해서 사용. CNN Layer + LSTM(RNN) Layer CNN Layer의 마지막의 2개의 Fully-Connected Layer 층은 CNN층으로 변경한다 RNN부분에서 LSTM을 사용하고 싶으면 gru=False로 주고, GRU를 사용할 때는 gru=True 1> CRNN parameter - Input_shape : ( 256, 32, 1 ) - num_classes : 87 --> 라벨로 사용되는 클래스 수 2> CRNN Model output_shape : (학습과 예측의 모델이 각각 존재한다) Model Architecture : CNN(6) + RNN(LSTM)(2) + FC(1) + Activation(..
[OCR] CRNN Model_참고 자료 앞으로 진행 할 CRNN 관련 포스팅에서 사용되는 논문과 코드에 대해 적어둔 포스팅입니다:) 1. 참고 논문 (Text Recognition) Reference Paper : https://arxiv.org/abs/1507.05717 An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition Image-based sequence recognition has been a long-standing research topic in computer vision. In this paper, we investigate the problem of scene t..