Coder Social home page Coder Social logo

level2_nlp_mrc-nlp-12's Introduction

오픈 도메인 질의응답 Open-Domain Question Answering

주어진 지문을 이해하고, 주어진 질의의 답변을 추론하는 태스크

일정 Schedule

프로젝트 전체 기간(2주): 6월 7일 (수) 10:00 ~ 6월 22일 (목) 19:00

대회 플랫폼 Platform

AI Stages

팀 Team

훈제연어들

문지혜 박경택 박지은 송인서 윤지환
Gmail Badge Gmail Badge Gmail Badge Gmail Badge Gmail Badge
GitHub Badge GitHub Badge GitHub Badge GitHub Badge GitHub Badge

랩업 리포트 Wrap-up Report

랩업 리포트

저장소 구조 Repository Structure

level2_nlp_mrc-nlp-12/
├── assets/
│
├── code/
│   │
│   ├── eda/
│   │   ├── eda.ipynb
│   │   └── post_eda.ipynb
│   │
│   ├── install/
│   │   ├── elastic_install.sh
│   │   └── install_requirements.sh
│   │
│   ├── retriever/                              # Retiever 실험 코드 모음
│   │   ├── dpr/
│   │   │   ├── data_loaders.py                 # Dense retriever 학습을 위한 dataloader
│   │   │   ├── model.py                        # Dense retriever 학습을 위한 encoder
│   │   │   └── trainer.py                      # Dense retriever trainer
│   │   │
│   │   ├── elastic_setting.json                # retrieval_elastic.py를 위한 설정 파일
│   │   ├── retrieval_bm25.py                   # BM25 실험
│   │   ├── retrieval_dense.py                  # DPR 실험
│   │   ├── retrieval_elastic.py                # elastic search 적용 코드
│   │   ├── retrieval_faiss.py                  # FAISS 적용 코드
│   │   └── retrieval_tfidf.py                  # TFIDF 실험 코드
│   │
│   ├── trainer/
│   │   └── trainer_qa.py
│   │
│   ├── utils/
│   │   ├── evalutaion.py
│   │   └── utils_qa.py
│   │
│   ├── arguments.py                            # 모델 설정, 학습 설정, 데이터 설정 등
│   ├── inference.py                            # ODQA 모델 평가 또는 제출 파일 (predictions.json) 생성
│   ├── inference.sh                            # inference.py를 실행하기 위한 스크립트
│   ├── load_data.py                            # 데이터셋을 정의하고 DatasetDict를 반환하는 스크립트
│   ├── run.sh                                  # train.py를 실행하기 위한 스크립트
│   ├── run_mrc.py
│   ├── train.py                                # MRC, Retrieval 모델 학습 및 평가
│   └── README.md                               # ODQA 모델 평가 또는 제출 파일 (predictions.json) 생성
│
├── data/
│   ├── retrieved_context_dataset/              # retrieval에 사용되는 corpus
│   │   ├── train_3.csv
│   │   └── valid_3.csv
│   │
│   ├── test_dataset/                           # MRC 모델 평가 시 사용되는 데이터
│   │   ├── validation/
│   │   └── dataset_dict.json
│   │
│   └── train_dataset/                          # MRC 모델 학습 시 사용되는 데이터
│       ├── trian/
│       ├── validation/
│       └── dataset_dict.json
│
└── README.md

사용법 Usage

학습 train

$ ./code/run.sh

추론 inference

$ ./code/inference.sh

DPR 학습 및 추론

code/ 디렉토리에서,

python retriever/retrieval_dense.py

평가 방법 Evaluation Metric

  1. Exact Match(EM)
    • 모델의 예측과 실제 답이 정확하게 일치하는 경우 1, 아니면 0
    • 띄어쓰기나 특수문자를 제외하여 비교
    • 여러 개의 실제 답 중 하나라도 일치하는 경우 정답
  2. F1 Score
    • 리더보드에 반영되지 않는 참고용 점수
    • 예측한 답과 ground-truth 사이의 token overlap을 f1으로 계산

대회 결과 Competition Result

리더보드 순위 EM F1
Public 8 68.33 78.57
Private 10 (2🔻) 65.0 77.03

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.