본문 바로가기

DeepLearning/OCR_

(14)
[KR_OCR] 한국어 데이터셋(AI HUB) 기본적인 CRNN의 구조에 대한 파악이 끝난 후에 한국어 인식을 위한 한국어 데이터 셋을 사용하기 위한 준비. Korea Sign Datasets OCR 인식을 위한 한국 표지판 데이터 셋을 다운 - 어노테이션이 포함된 파일로 다운로드한다 - 데이터 다운로드 링크 : http://www.aihub.or.kr AI 오픈 이노베이션 허브 AI 챗봇,안면인식 등 지능형 서비스 구현에 활용할 수 있는 지식베이스와 기계학습용 이미지 데이터를 제공합니다. www.aihub.or.kr >> 위의 주소로 들어가서 관광 카테고리에 가면 한국 표지판 데이터를 다운로드할 수 있다. >> 다운로드한 뒤 압축을 푼 상태에서 'data/K-sign/' 경로 아래로 데이터를 넣는다 ( 위 경로 아래에는 크롤링 데이터 / 고해상도 ..
[ENG_OCR] ImageWithTextBoxes 디버깅을 위한 코드 CRNN 학습 도중에 에러가 나는 이미지에 대해 시각적으로 보기 위해 만든 코드 그 외에도 데이터셋의 형태 파악에 사용 가능 1. Image와 함께 Annotation된 라벨 값 시각화 작업 1> 필요한 라이브러리 로딩 import matplotlib.pyplot as plt import PIL import pickle import os import cv2 import numpy as np 2> 피클파일 불러오기 from data_cocotext import GTUtility with open('gt_util_cocotext_val.pkl', 'rb') as f: gt_util_val = pickle.load(f) 3> 확인하고 싶은 특정이미지의 인덱스 확인. idx = gt_util_val.image_..
[ENG_OCR] CRNN_Training 모델 학습 프로세스 아래에서 진행되는 코드는 아래 깃허브를 기본 베이스로 사용하였습니다:) https://github.com/mvoelk/ssd_detectors mvoelk/ssd_detectors SSD-based object and text detection with Keras, SSD, DSOD, TextBoxes, SegLink, TextBoxes++, CRNN - mvoelk/ssd_detectors github.com CRNN_Train.py 1> 필요한 라이브러리 로딩 import numpy as np import matplotlib.pyplot as plt import os import editdistance import pickle import ti..
[ENG_OCR] CRNN_cocotext 데이터 전처리 작업 Datasets : COCO/Train2014 Annotations : COCO_Text.json https://vision.cornell.edu/se3/coco-text-2/ COCO-Text: Dataset for Text Detection and Recognition | SE(3) Computer Vision Group at Cornell Tech COCO-Text: Dataset for Text Detection and Recognition The COCO-Text V2 dataset is out. Check out our brand new website! Check out the ICDAR2017 Robust Reading Challenge on COCO-Text! COCO-Text is a n..
[OCR] CRNN Model_기본 구조 backbone 역할을 하는 함수 : 논문에서 언급한 대로 VGG-16 모델 구현해서 사용. CNN Layer + LSTM(RNN) Layer CNN Layer의 마지막의 2개의 Fully-Connected Layer 층은 CNN층으로 변경한다 RNN부분에서 LSTM을 사용하고 싶으면 gru=False로 주고, GRU를 사용할 때는 gru=True 1> CRNN parameter - Input_shape : ( 256, 32, 1 ) - num_classes : 87 --> 라벨로 사용되는 클래스 수 2> CRNN Model output_shape : (학습과 예측의 모델이 각각 존재한다) Model Architecture : CNN(6) + RNN(LSTM)(2) + FC(1) + Activation(..
[OCR] CRNN Model_참고 자료 앞으로 진행 할 CRNN 관련 포스팅에서 사용되는 논문과 코드에 대해 적어둔 포스팅입니다:) 1. 참고 논문 (Text Recognition) Reference Paper : https://arxiv.org/abs/1507.05717 An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition Image-based sequence recognition has been a long-standing research topic in computer vision. In this paper, we investigate the problem of scene t..