Coder Social home page Coder Social logo

kovicuna's Introduction

KoVicuna icon

Update Logs


KoVicuna: Korean Vicuna Model based on Vicuna (feat. LLAMA)

Vicuna 모델을 학습한 방식과 동일한 방식과 모델셋으로 학습을 진행한, 한국어 Vicuna 모델입니다.

예시

스크린샷 2023-04-20 오후 12 59 37

데이터셋 제작 방법

데이터셋은 기본적으로 ShareGPT에서 제공한 62만 대화문 데이터셋을 기반으로 합니다.

해당 대화문을 DeepL 을 통해 모두 번역했습니다. 번역본 링크

학습경과

  1. 번역된 62만 대화문과 Vicuna 7B 를 준비
  2. A100 * 8 개로 15시간 동안 학습 진행
  3. 자세한 학습 내역은 이곳을 참고해주세요.

W B Chart 2023  4  20  오후 3_57_14

데모

코랩

코랩프로일 경우 코랩에서 바로 사용해 보실수 있습니다.

주소를 통해 코랩에 들어간후 자세한 가이드를 따라해주세요.

우바부가 (text-generation-webui)

해당 모델은 비쿠나1.1v으로 학습되었으므로 우바부가를 사용할경우 Character 탭 에서 다음을 설정해주세요.

  1. Your name -> USER:
  2. Character's name -> ASSISTANT:

가중치공개

  • 준의 허깅페이스에서 가중치 를 확인할 수 있습니다.

Author

kovicuna's People

Contributors

melodysdreamj avatar

Stargazers

Shawn Shawn Kim avatar  avatar 마민정 (MinJeong Ma) avatar YEJIN SON avatar Austin Cho avatar  avatar Jonghyun Ho avatar IKSUN avatar JeongHoon Baek avatar SUN YOUNG HWANG avatar DongGeon Lee avatar Kyung-Su Kang avatar Yohan Na avatar tomriddle7 avatar Lin Tengyi avatar JIHUN KIM avatar  avatar Minji (Elena) Woo avatar SeongjaeMoon avatar seonu avatar Kim yeonsu avatar Shinhyeok Hwang avatar  avatar Byeongjoo Kim avatar iamiks avatar EasyDev avatar Jeehoon Kang avatar JiwonMoon avatar  avatar Jisub Kwak avatar Hyunwoo Ko avatar Seungyoun, Shin avatar Sehun Heo avatar Zayden avatar hanjung avatar Jinhyeong avatar  avatar Mattias Lee avatar Jaeyoon Jung avatar MO_DEV avatar Unchun Yang avatar  avatar donny-son avatar Jiyeol Park avatar  avatar  avatar  avatar ripepersimmon avatar Playdev avatar Sumin Kim avatar Jay avatar Hyeongmin Moon avatar J.P Lee avatar  avatar JS avatar worker-ants avatar Sang Hun Kim avatar Jungseob Lee avatar Soohwan Kim avatar Kim, Hyuntak avatar SeungJun avatar  avatar Chanwoong Kim avatar Taemin Lee avatar ChunKoo Park avatar pklazy avatar  avatar Seongmin Park avatar Kyunghoon Kim avatar Chanyong Park avatar Kyung Min Kim avatar hwang tae seung avatar HoTaek Joo avatar oscar.rs avatar Jiho Lee avatar Changbeom Ahn avatar Seongjin Lee avatar yj.gaia avatar Jiyoon No avatar Shim Daeyeol avatar ilgu kim avatar Taewan Kim avatar  avatar Junseo Park avatar Sandalots avatar 爱可可-爱生活 avatar LeeJonghoon avatar DanielKim avatar 김병준 avatar snoop2head avatar gyunggyung avatar Eunkwang Jeon avatar Woojun Lee avatar 송영숙 avatar Jeongwan Kang avatar Lee Jun Hyuk avatar Minyoung Lee (carl.brain) avatar Tae-Geun Kim avatar  avatar Sungguk Cha avatar

Watchers

Tae-Hyoung Choi avatar  avatar  avatar  avatar

kovicuna's Issues

프롬프트 템플릿 문의

안녕하세요! 좋은 모델 올려주셔서 감사합니다.

sampling_params = SamplingParams(temperature=0.7, top_p=0.95, max_tokens=MAX_TOKENS)
llm = LLM(model="junelee/ko_vicuna_7b", tensor_parallel_size=4)

현재 vllm을 사용하여 다음과 같은 방식으로 모델을 실행하려고 하는데, 프롬프팅을 어떻게 진행해야 하는지 정보를 찾을 수 없어 이슈를 작성합니다.

f"### USER:\n{instruction}\n\n### ASSISTANT:\n"

이 양식과 instruction을 그대로 주는 양식 모두를 테스트 해 보았는데 모두 이상한 출력이 나왔습니다. instruction tunning 된 모델인 것 같은데, 어떻게 작성해야 하나요?

Tokenizer 관련 문의

안녕하세요,
KoVicuna 모델을 사용하려고 하는데 혹시 tokenizer는 어떤걸 사용하면 되나요?

tokenizer = AutoTokenizer.from_pretrained('junelee/ko_vicuna_7b')

이 명령어를 사용하니

RecursionError: maximum recursion depth exceeded while getting the str of an object

아래와 같은 에러 메세지가 나왔습니다.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.