본문 바로가기

분류 전체보기

(110)
[Sequence Modeling With CTC]번역글 본문 내용은 아래 링크 distill에서 작성 된 글을 번역 한 글입니다 Sequence Modeling With CTC https://distill.pub/2017/ctc/ Sequence Modeling with CTC A visual guide to Connectionist Temporal Classification, an algorithm used to train deep neural networks in speech recognition, handwriting recognition and other sequence problems. distill.pub CTC는 음성인식과 손글시 인식 그리고 다른 시퀀스 문제들에서 딥 뉴럴 네트워크를 훈련시키는데 사용되는 알고리즘이다. 그리고 아래 내용은 이에 ..
[KR_OCR] 한국어학습을 위한 라벨 라벨 값이 알파벳 대문자와 소문자로 구성된 영어와 달리 새로운 라벨이 필요 학습에 사용하는 데이터를 활용하여 Label_dictionary 생성 1. K-Sign Data(AI HUB) 지난번에 AI HUB에서 다운로드한 어노테이션을 활용하여 Dict 생성 1> K-Sign데이터로 GTUtility 객체 생성 from data_KSign import GTUtility gt_util = GTUtility('data/K-Sign/HighQuality/', quality='high') - 앞 포스팅에서 만든 GTUtility를 사용하여 객체 생성하기 2> 생성된 객체의 text값 가져오기 text = gt_util.text - 생성 된 객체의 .text 안에 학습에 사용하는 이미지 데이터의 text값이 담겨져..
[KR_OCR] 한국어 데이터셋(AI HUB) 기본적인 CRNN의 구조에 대한 파악이 끝난 후에 한국어 인식을 위한 한국어 데이터 셋을 사용하기 위한 준비. Korea Sign Datasets OCR 인식을 위한 한국 표지판 데이터 셋을 다운 - 어노테이션이 포함된 파일로 다운로드한다 - 데이터 다운로드 링크 : http://www.aihub.or.kr AI 오픈 이노베이션 허브 AI 챗봇,안면인식 등 지능형 서비스 구현에 활용할 수 있는 지식베이스와 기계학습용 이미지 데이터를 제공합니다. www.aihub.or.kr >> 위의 주소로 들어가서 관광 카테고리에 가면 한국 표지판 데이터를 다운로드할 수 있다. >> 다운로드한 뒤 압축을 푼 상태에서 'data/K-sign/' 경로 아래로 데이터를 넣는다 ( 위 경로 아래에는 크롤링 데이터 / 고해상도 ..
[Connectionist Temporal Classification]번역 글 CRNN모델에서 마지막에 loss를 계산할 때 ctc_loss를 사용하기 때문에 CTC 관련해서 어느 정도 알고 있어야 함 아래 내용은 위의 링크의 Medium에서 작성 된 글을 번역 한 글입니다. An Intuitive Explanation of Connectionist Temporal Classification https://towardsdatascience.com/intuitively-understanding-connectionist-temporal-classification-3797e43a86c An Intuitive Explanation of Connectionist Temporal Classification Text recognition with the Connectionist Temporal..
[ENG_OCR] ImageWithTextBoxes 디버깅을 위한 코드 CRNN 학습 도중에 에러가 나는 이미지에 대해 시각적으로 보기 위해 만든 코드 그 외에도 데이터셋의 형태 파악에 사용 가능 1. Image와 함께 Annotation된 라벨 값 시각화 작업 1> 필요한 라이브러리 로딩 import matplotlib.pyplot as plt import PIL import pickle import os import cv2 import numpy as np 2> 피클파일 불러오기 from data_cocotext import GTUtility with open('gt_util_cocotext_val.pkl', 'rb') as f: gt_util_val = pickle.load(f) 3> 확인하고 싶은 특정이미지의 인덱스 확인. idx = gt_util_val.image_..
[ENG_OCR] CRNN_Training 모델 학습 프로세스 아래에서 진행되는 코드는 아래 깃허브를 기본 베이스로 사용하였습니다:) https://github.com/mvoelk/ssd_detectors mvoelk/ssd_detectors SSD-based object and text detection with Keras, SSD, DSOD, TextBoxes, SegLink, TextBoxes++, CRNN - mvoelk/ssd_detectors github.com CRNN_Train.py 1> 필요한 라이브러리 로딩 import numpy as np import matplotlib.pyplot as plt import os import editdistance import pickle import ti..
Django_Admin Django_Admin Process # 장고는 어드민 계정이 이미 만들어져있다. 유저만 생성 하면 된다 1> superuser 생성 python manage.py createsuperuser - Username : 유저 네임 입력 - Password : 비밀번호 입력 - 로그인을 하기위한 superuser 생성 과정 2> settings.py 확인 - settings.py에 admin이 잘 등록 되어 있는지 한번 확인한다. 3> 서버실행 python manage.py runserver - 서버를 실행 시킨 뒤 서버 주소창이 생성되면 주소를 확인한다. - 어드민 계정으로 들어가기 위해 서버주소/admin 을 주소창에 입력 - 아래와 같은 화면이 뜨면 설정한 아이디와 비밀번호로 로그인 4> 어드민에서 DB..
Django_Model 1. Django_Model의 특징 - Django는 내장 ORM을 통해 sql문 작성 없이도 DB의 접근이 가능하다. - Model은 DB와 연결되어있다. - SQL문장 없이 장고 모델을 통해 DB의 CRUD가 가능하다 >> 모델 안의 Class가 DB의 테이블 역할 - DB는 myproject(base_dir)에 생성된다. - 아래와 같이 상속을 받아야 Django의 ORM을 사용할 수 있다. From django.db import models Class Post(models.Model): #상속을 받아야 사용가능 2. Django_Model 생성 1> 모델에 class 생성 blog/models.py - 여기서 생성 된 class 1개가 테이블 1개를 의미한다 - 변수이름 = models. 변수 타..