[학습 계획] OCR

[STUDY]/[학습 계획서]

[학습 계획] OCR

eunma 2024. 12. 30. 09:00

학습 계획서

Optical Character Recognition(OCR)

주제: OCR의 개념과 활용 이해하기

대상: 파이썬을 사용해 본 수준의 초보자

강의자료: 네이버 부스트코스

수학 공식을 이해하는 딥러닝 모델 (OCR)

부스트코스 무료 강의

www.boostcourse.org

목표

OCR의 핵심 개념 이해
이미지에서 텍스트를 추출하는 과정 이해
OCR 알고리즘을 구현하고 시각화할 수 있는 능력 갖추기
현실 세계에서 OCR이 어떻게 사용되는지 이해

1차시: OCR이란 무엇인가? (개념 이해)

• 학습 목표: OCR의 기본 개념과 필요성을 이해한다

• 학습 내용:

OCR의 정의, 기본개념
이미지에서 텍스트를 추출하는 원리
Faster-RCNN과 SSD의 이해
Segmentation의 대표적인 모델인 U-Net과 Mask R-CNN
Detection과 Segmentation 기반의 Text Localization 모델

• 실습 확장:

Python과 OpenCV를 활용한 이미지 전처리 실습
- 간단한 이미지를 불러와 그레이스케일 변환, 이진화, 노이즈 제거 등의 전처리 과정을 수행합니다.
Pre-trained 모델을 활용한 텍스트 검출
- 오픈소스 라이브러리인 Tesseract OCR을 설치하고, 간단한 이미지를 통해 텍스트를 추출해 봅니다.

2차시: Text Recongnition

• 학습 목표: 텍스트 인식의 기초 이해 및 다양한 모델을 학습한다.

• 학습 내용:

CNN 기반 네트워크로 텍스트 인식 수행
CTC(Connectionist Temporal Classification)의 이해
Attention 메커니즘을 활용한 텍스트 인식 (Teacher Forcing)
ASTER 모델의 변형 및 코드 분석
CNN 기반 CSTR 모델과 Visual, Semantic 정보를 활용한 모델
SATRN 모델 이해 및 코드 리뷰
Detection과 Recognition의 End-to-End 수행 이해
Mask TextSpotter의 Pixel Voting 이해

• 실습 확장:

간단한 CNN 모델 구현
- Keras를 활용하여 숫자 이미지(MNIST 데이터셋)의 분류 모델을 구현하고 학습시켜 봅니다.
CTC 손실 함수 적용 실습
- 파이썬으로 간단한 시퀀스 데이터를 생성하고, CTC 손실 함수를 적용하여 출력 시퀀스를 예측해 봅니다.
Pre-trained 모델 활용
- 오픈소스 OCR 모델(예: CRNN)을 활용하여 이미지에서 텍스트를 인식해 보고, 결과를 분석합니다.

3차시: Evaluation Metrics

• 학습 목표: Detection과 Recognition의 성능 평가를 위한 다양한 지표를 이해한다.

• 학습 내용:

Detection 성능 평가를 위한 지표 탐색 및 경험
Detection과 Recognition의 End-to-End 평가를 위한 대표적인 지표 분석
수식 인식을 위한 적절한 평가 지표 고민 및 프로젝트 계획 수립
성능을 개선을 위한 방법 탐색

• 실습 확장:

모델 평가 지표 계산
- 주어진 예측 결과와 실제 라벨을 비교하여 Precision, Recall, F1-Score 등을 계산해 봅니다.
Bounding Box 평가
- Detection 결과의 IoU(Intersection over Union)를 계산하여 모델의 위치 정확도를 평가합니다.
End-to-End 평가 실습
- 텍스트 검출 및 인식 결과를 종합하여 전체 시스템의 정확도를 평가하는 방법을 실습합니다.

4차시: OCR의 실제 활용 사례와 프로젝트

• 학습 목표: OCR의 실제 활용 사례를 이해하고 간단한 프로젝트를 진행한다.

• 학습 내용:

예시 1) 문서 디지털화: 스캔한 문서에서 텍스트 추출
예시 2) 자동차 번호판 인식 시스템
예시 3) 스마트폰 앱에서의 OCR 활용
예시 4) 명함에서 정보 추출하기
확장 - OCR의 한계와 최신 연구 동향

'[STUDY] > [학습 계획서]' 카테고리의 다른 글

[학습 계획]야 너두 파인튜닝 할 수 있어 (0)	2025.02.22
[학습 계획] Github 기초부터 Master까지 (1)	2024.12.31
[학습 계획] 푸리에 변환 (1)	2024.12.19

현재글[학습 계획] OCR

EunmaStudio

카부캠, 오블완, ktb, 이상감지시스템, Agent, magentic_one, 카카오테크부트캠프, ai, exaone, 네이버부스트코스, deepseek, 티스토리챌린지, 학습계획서, 카카오테크부트캠프1기, human pose estimation, 에버엑스, KDT, 딥식이, 카테부, GPT,

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

EunmaStudio

[학습 계획] OCR

학습 계획서

목표

1차시: OCR이란 무엇인가? (개념 이해)

• 학습 목표: OCR의 기본 개념과 필요성을 이해한다

2차시: Text Recongnition

• 학습 목표: 텍스트 인식의 기초 이해 및 다양한 모델을 학습한다.

3차시: Evaluation Metrics

• 학습 목표: Detection과 Recognition의 성능 평가를 위한 다양한 지표를 이해한다.

4차시: OCR의 실제 활용 사례와 프로젝트

• 학습 목표: OCR의 실제 활용 사례를 이해하고 간단한 프로젝트를 진행한다.

'[STUDY] > [학습 계획서]' 카테고리의 다른 글

'[STUDY]/[학습 계획서]'의 다른글

티스토리툴바

[학습 계획] OCR

학습 계획서

목표

1차시: OCR이란 무엇인가? (개념 이해)

• 학습 목표: OCR의 기본 개념과 필요성을 이해한다

2차시: Text Recongnition

• 학습 목표: 텍스트 인식의 기초 이해 및 다양한 모델을 학습한다.

3차시: Evaluation Metrics

• 학습 목표: Detection과 Recognition의 성능 평가를 위한 다양한 지표를 이해한다.

4차시: OCR의 실제 활용 사례와 프로젝트

• 학습 목표: OCR의 실제 활용 사례를 이해하고 간단한 프로젝트를 진행한다.

'[STUDY] > [학습 계획서]' 카테고리의 다른 글

'[STUDY]/[학습 계획서]'의 다른글

관련글

티스토리툴바