내마리(MyMary): 내 마음을 들여다 보는 챗봇

챗봇과의 대화를 통해 ‘나’에 대해 더 잘 알아갈 수 있는 챗봇, 내마리(MyMary) 서비스입니다. 내마리(MyMary)는

사용자의 채팅 속에서 맥락을 파악하고 사용자에게 따뜻한 공감을 제공하며
질문 또는 생각 정리의 형식으로 사용자의 채팅에 대한 답변을 마무리함으로써
사용자가 공감을 기반으로 챗봇과 상호작용할 수 있게 되어, 궁극적으로 사용자 자신과 상호작용 하는 (= 내 마음을 들여다보는) 경험을 제공합니다.

1. 프로젝트 데모 Project Demo

2. 팀 & 역할 Team & Roles

공통	문지혜	박경택	박지은	송인서	윤지환


데이터 생성 데이터 검수 모델 별 실험	평가 지표 리서치 평가 전략 설계	프롬프트 엔지니어링 LangChain 연동 발표	개발환경 구성 베이스라인 작성 데이터 EDA 발표	FE/BE 구현 DB 연결 LangChain 연동	PM 베이스라인 작성 데이터 취합 데이터 전처리 LangChain 연동

3. 실행 방법 How-to-Run

Dependency Management

poetry shell

Finetuning

finetuning 디렉토리에서

python train.py

Merge QLoRA layer into LLM backbone

finetuning 디렉토리에서

python merge_lora.py

Inference

finetuning 디렉토리에서

python inference.py

Server

Backend

server/backend 디렉토리에서

python app.py

Frontend

server/frontend 디렉토리에서

npm install

and

npm start

4. 프로젝트 아키텍처 Project Architecture

5. 데이터 Data

HuggingFace 데이터셋 리포지토리
공감형 대화 공개 데이터셋은 single-turn 데이터 8,194개와 multi-turn 데이터 18,668개로 구성됩니다.
사용자의 채팅에 대한 응답인 챗봇의 채팅은 '공감형 반응 - 질문' 형태를 띱니다.
Finetuning 시 모델의 입력은 프롬프트 템플릿으로 감싸주었으며, 데이터 생성 및 파인튜닝, 추론 등에서 사용한 프롬프트 템플릿은 data/prompt/ 디렉토리를 참고해주세요.

6. 모델 Model

Backbone

KULLM-Polyglot-Ko-12.8B

Polyglot-Ko-12.8B 모델을 backbone으로 하여 15만 2천여 건의 싱글-턴 대화로 finetuning한 모델입니다.

QLoRA layer

LoRA 기법에 4-bit quantization, double quantization, paged optimizer 등의 방법을 사용하여 VRAM 32GB single GPU에서 full finetuning이 가능하게 했습니다.

7. 평가 Evaluation

평가를 위해 비교한 모델은 한국어 LLM 3가지(모델 파라미터수 7B, ~13B)와 현재 서비스 중인 GPT-3.5 모델(모델 파라미터 수 175B)입니다.

G-Eval

G-eval 논문을 참고하여 6가지 항목을 선정하고, 추가적으로 (1) 공감 능력, (2) 대화 유도 항목을 추가하여 평가하였습니다.

Human Evaluation

평가 항목은 크게 (1) 기초 능력, (2) 공감, (3) 맥락 유지, (4) 질문 항목으로 나뉩니다. 각각의 항목은 다시 두세 항목으로 세분류하여 평가를 진행하였습니다.

8. 서빙 Serving

서빙 파트의 자세한 내용은 server/ 디렉토리의 README를 참고해주세요.

9. 공개 링크 Public Links

Presentation

boostcampaitech5 / level3_nlp_finalproject-nlp-12 Goto Github PK

level3_nlp_finalproject-nlp-12's Introduction

내마리(MyMary): 내 마음을 들여다 보는 챗봇

1. 프로젝트 데모 Project Demo

2. 팀 & 역할 Team & Roles

3. 실행 방법 How-to-Run

Dependency Management

Finetuning

Merge QLoRA layer into LLM backbone

Inference

Server

Backend

Frontend

4. 프로젝트 아키텍처 Project Architecture

5. 데이터 Data

6. 모델 Model

Backbone

KULLM-Polyglot-Ko-12.8B

QLoRA layer

7. 평가 Evaluation

G-Eval

Human Evaluation

8. 서빙 Serving

9. 공개 링크 Public Links

10. 참고문헌 Reference

level3_nlp_finalproject-nlp-12's People

Contributors

Stargazers

Forkers

level3_nlp_finalproject-nlp-12's Issues

Background

To Do

Background

To Do

Background

To Do

Background

To Do

Background

To Do

Background

To Do

See Also

Background

To Do

Background

To Do

Background

To Do

See Also

Background

To Do

See Also

Background

To Do

Metrics Research

Preparation

Evaluation code implementation

Background

To Do

Background

To Do

Background

To Do

See Also

Background

To Do

Background

To Do

Background

To Do

Background

To Do

See Also

Background

To Do

Background

To Do

See Also

Background