MLLMArxivTalk

최신 MLLM 관련 스터디. 기본 오후에 진행. 논문, 강의, 코드, 뉴스, 블로그 등 다양한 자료로 학습.

MLLM, LLM, NLG, Dialogue, Reinforcement learning, Distillation, Efficient, Sentence similarity, multiple tasks, multimodal, Stable diffusion, TTS, Text-To-Video, All-To-All, 우주, 생명, 지능, 윤리, 규제, 법, 노화, 의학, 투자, 개발, 인프라, 디자인, 경영, ETC...

유망 스타트업 C레벨, 국내외 탑티어 연구자, 국내외 탑티어 대학, 대학원 재학생과 졸업생, 석학, 교수 등 A급 인재들이 최신 논문, 강의 등 스터디 및 프로젝트 진행.

기본 매주 수요일 오후 7시반. 사전 학습 없이 논문 읽기 최대 20분, 토론 최대 40분. 한 번에 1 ~ 10개 논문, 강의 등 진행. 지금까지는 항상 3개. 주제 논문 선정은 자유. 탑티어 학회 논문 및 프로젝트 제작 예정.

주말을 포함하여, 거의 매일 추가 스터디 존재. 흥미로운 주제거나 참여 되는 날만 중간에 들어와서 중간에 나가도 무관. 모든 규칙은 협의 가능. 오프라인 모임도 예정. 자율 참여.

진행 사항 + 예정

2023-02-16 23:30 ~ 24:45 염기웅, 강수진, 고현웅

2023-02-19 23:30 ~ 24:30 염기웅, 박상준, 강수진

2023-02-22 19:30 ~ 21:00 염기웅, 박상준, 이웅기, 이현제

2023-02-23 23:00 ~ 24:00 염기웅, 박상준, 황명하

2023-02-24 17:00 ~ 19:00 염기웅

2023-03-01 20:30 ~ 21:40 염기웅, 이대환

2023-03-04 22:00 ~ 23:30 염기웅, 황명하

2023-03-05 21:00 ~ 21:30 염기웅,

LLaMA-7B, LLAMA Up-data, LLaMA: INT8 edition, UForm

2023-03-08 00:00 ~ 01:00 염기웅, 김미담

2023-03-08 19:30 ~ 20:30 염기웅, 최재훈, 황지현, 김혜인

2023-03-09 20:00 ~ 22:00 염기웅, 윤상현, 신승욱

2023-03-10 21:00 ~ 22:20 염기웅, 나요한, 최재훈, 외 청강 5인

2023-03-10 20:00 ~ 21:00 염기웅, 황지현, 이대환, 나요한

영어만 사용은 금지. 한국어 중심 사용. 특수 용어는 영어 사용.
1주일에 논문 2개 이상 스터디. 되는 사람은 10개 이상.
3분에서 20분 현장에서 논문 읽기. 5분에서 30분 토론.
1시간 스터디 시, 바로 나가도 됨. 원할 때 10분 이하 참여도 무관. 자유롭게 진행. 2시간 매일도 가능.
각자 더 뛰어난 게 있다는 것을 인지. 다들 대단한 분들이니 질문 많이 하고, 정보 공유 자주.
본인이 하기로 한 일만은 수행. 한다고 말하고, 안 하는 것은 민폐다.
기본적으로 녹화 후 내부 공유.
정보를 혼자 알게 쓰지 말고, 다 같이 알게 말하기.
개인 사정으로 스터디 탈퇴 시, 자기소개에 인사 작성.
여러 기관 좋은 규칙 붙여넣기.
팀에 도움이 된다고 판단하면, 위 규칙을 모두 무시하고 행동.
추가.

후보

앞으로 할만한 논문, 코드, 강의 등.

papaer

github

youtube

other

참여 질문 리스트

스터디에 참여해도 될지 고민하는 분들께, 몇 가지 질문을 드려봅니다. 대답 가능하신 것만 해주세요.

검색이나 chatgpt나 무엇을 쓰든, 작성한 내용을 이해만 하시면 괜찮습니다.

기초

lstm, bert, gpt, t5 장단점 한계 차이 특징
가장 흥미롭게 읽은 논문 5문장 요약
sdt를 쓰면 좋을 때와 아닐 때
모든 것을 end to end로 하는 게 좋은가?
파라미터 사이즈 1조 개 이상의 모델을 돌릴 때 필요한 서버는?
현 최대의 파라미터 수를 가진 모델은?
P-tuning 에 대한 설명과 개선점. V3가 나온다면 개선점은?
강화학습을 nlp task에 쓴 모델 설명 5개
멀티 모달, 멀티 랭기지, 멀티 테스크가 항상 좋은가?
형태소와 워드피스 등 토크나이저의 장단점
논문을 20분 안에 읽거나 사전 학습 가능 여부
스터디 시 항상 참여 가능한가?

심화

∞-former는 이론상 1조 7500억개의 토큰을 손실 없이 생성할 수 있는가?
Gpt4의 파라미터 개수와 구조
Show Don’t Tell 을 한국어로 적용하는 방법
retro gpt3 비교 한계 분석
T5 T0 비교 한계 의미 가치 분석
You는 어떤 모델로 만들었는가?
우주의 모양은?
1경년 후에 무슨 일이 일어나는가?
순간이동을 누가 언제 어떻게 왜 구현 했는가?
영생하는 동물과 한계는?
다음 빅뱅을 버티는 방법
역대 최연소 교수의 최고의 논문은?
https://www.nature.com/articles/d41586-023-00340-6 https://www.nature.com/articles/d41591-023-00014-w https://www.nature.com/articles/s42256-022-00593-2 분석 요약
현 스터디 멤버 분석
P-tuning 시 I love you로 고정해도 같은 성능이 나오는가?
https://arxiv.org/abs/2009.01325 https://arxiv.org/abs/2203.02155 분석 및 chatgpt 구조 분석
https://arxiv.org/pdf/2301.00704v1.pdf https://arxiv.org/pdf/2301.12597v1.pdf 비교 분석

참고로 저는 90프로 이상의 답변은 바로 됩니다. 나머지는 약 2, 3개는 검색이 필요합니다. 팀원 중 많은 분이, 검색 시 완벽한 답변이 가능합니다.

기초 답변이 완벽하거나, 심화에서 올바른 접근을 하면 합류. 전부 완벽하면 모시고, 애매하면 인터뷰, 아니면 탈락.

gyunggyung / mllmarxivtalk Goto Github PK

mllmarxivtalk's Introduction

MLLMArxivTalk

진행 사항 + 예정

규칙

후보

papaer

github

youtube

other

mllmarxivtalk's People

Contributors

Stargazers

Watchers

Forkers

mllmarxivtalk's Issues

Recommend Projects

Recommend Topics

Recommend Org