관리 메뉴

NineTwo meet you

HRCenterNet 환경 세팅 및 데이터 학습 진행 튜토리얼 본문

기타

HRCenterNet 환경 세팅 및 데이터 학습 진행 튜토리얼

NineTwo 2021. 8. 24. 14:58
반응형

https://github.com/Tverous/HRCenterNet

 

GitHub - Tverous/HRCenterNet: HRCenterNet: An Anchorless Approach to Chinese Character Segmentation in Historical Documents

HRCenterNet: An Anchorless Approach to Chinese Character Segmentation in Historical Documents - GitHub - Tverous/HRCenterNet: HRCenterNet: An Anchorless Approach to Chinese Character Segmentation i...

github.com


0. 환경 세팅

$ git clone https://github.com/Tverous/HRCenterNet.git
$ cd HRCenterNet/
$ pip install -r requirements.txt

1. data download

https://aihub.or.kr/aidata/30753

 

고서 한자 인식 OCR | AI 허브

버전 일자 변경내용 비고 1.0 2021.06.18 데이터 최초 개방   한자로 기록된 국가기록유산(고서, 고문헌 등)의 활용성과 접근성 향상을 위해 고서 이미지 속 한자의 디지털 텍스트를 자동으로 확보

aihub.or.kr

2. 폴더 구조화

HRCenterNet
    - data
        - images
        -- Train.csv
        -- Valid.csv
    - weights
    :

csv format

image_id labels
XXX.jpg obj_id_1 topleft_x topleft_y width height obj_id_2 topleft_x topleft_y width height ... 
: :

3. Training

$ python train.py --train_csv_path data/train.csv --train_data_dir data/images/ --val_csv_path data/val.csv --val_data_dir data/images/ --val --batch_size 8 --epoch 80

4. Evaluation

$ python evaluate.py --csv_path data/val.csv --data_dir data/images/ --log_dir weights/HRCenterNet.pth.tar

5. Test

$ python test.py --data_dir /path/to/images --log_dir /path/to/pretrained --output_dir /path/to/save/outputs

 


AI Hub 고서 한자 인식 OCR HRCenterNet

0. 폴더 구조화

:
code
    - data
        - trains
            - haeseo
                - images
                - json
            - hangseo
                - images
                - json
        - vals
            - haeseo
                - images
                - json
            - hangseo
                - images
                - json
        - tests
            - haeseo
                - images
                - json
            - hangseo
                - images
                - json
        - images
        -- test.csv 
        -- Train.csv
    - weights
    - output
    :

1. Training

$ python train.py --train_csv_path /path/to/data/train.csv --train_data_dir /path/to/trains/ --train_path /path/to/trains/ --test_path /path/to/vals/ --test_data_dir /path/to/vals/ --val --batch_size 8 --epoch 80

2. Evaluation

folder structure check!!

evaluation하는 이미지의 경우 haeseo/hangseo구분없이 한파일 안에 들어있어야 한다.

$ python evaluate.py --csv_path /path/to/data/test.csv --data_dir /path/to/data/images/ --log_dir weights/best.pth --output_dir /path/to/output/ --save_img

3. Test

folder structure check!!

trains와 vals 파일과 마찬가지로 test시에는 haeseo/hangseo구분있이 images/json폴더 모두 존재해야 한다.

$ python test_HRCN.py --data_dir /path/to/tests/

 

반응형
Comments